Hoje, a Volcano Engine lançou oficialmente o modelo de bean bag 1.8 e o modelo de criação de áudio e vídeo Seedance 1.5 pro na FORCE Power Conference. Dados de avaliação confiáveis mostram que Doubao Big Model ficou em primeiro lugar no mundo em termos de compreensão multimodal, capacidades de geração e capacidades de agente.
De acordo com Tan Dai, presidente da Volcano Engine, em dezembro deste ano, o uso médio diário de tokens do Doubao Big Model ultrapassou 50 trilhões, um aumento de mais de 10 vezes em comparação com o mesmo período do ano passado; atualmente, mais de 100 clientes corporativos acumularam uso de tokens de mais de 1 trilhão.
Como o mais recente modelo carro-chefe da família Doubao, o modelo grande Doubao 1.8 (Doubao-Seed-1.8) foi otimizado para cenários de agentes multimodais. Sua capacidade de chamar ferramentas, capacidade de seguir instruções complexas e capacidade de agente de sistema operacional foram aprimoradas, melhorando o planejamento e o nível de execução do modelo ao lidar com tarefas complexas.
Em termos de compreensão visual, o número de quadros de compreensão de vídeo único do Doubao 1.8 dobrou de 640 quadros para 1280 quadros. O modelo suporta a compreensão de vídeos muito longos em baixas taxas de quadros e pode chamar ferramentas para entender segmentos-chave em altas taxas de quadros. Esse recurso pode ser amplamente utilizado em educação on-line, inspeção de qualidade de produtos e outros cenários.
Em resposta à crescente demanda por criação de vídeo, a Volcano Engine lançou o modelo profissional de criação de áudio e vídeo Seedance 1.5. Este modelo não só tem tensão narrativa no nível do cinema e da televisão, pode capturar com precisão detalhes de movimento e apresentar delicadamente as emoções dos personagens, mas também fez um progresso revolucionário na tecnologia de sincronização de áudio e vídeo.
Seedance 1.5 pro adota uma arquitetura nativa inovadora de geração conjunta de áudio e vídeo, suporta sons ambientais, música de fundo, vocais e outros elementos, e atinge saída síncrona de áudio e vídeo em nível de milissegundos. Em termos de processamento de diálogo, o modelo suporta diálogo multipessoal e multilíngue, com alinhamento preciso da boca, abrangendo dialetos chineses (como dialeto de Sichuan, cantonês, etc.), inglês e línguas minoritárias, o que melhora muito o realismo e o potencial de criação global do conteúdo de vídeo.
A fim de reduzir ainda mais o limite e o custo de criação, a série Seedance lançará em breve a função "Rascunho de amostra". Os criadores podem primeiro gerar uma amostra de baixa resolução para visualização, e seus elementos principais são altamente consistentes com o filme final, verdadeiramente "visualização é o que você obtém". Os dados mostram que esse recurso pode ajudar os criadores a melhorar a eficiência geral em 65% e a reduzir os custos de criação ineficazes em 60%.
Atualmente, usuários individuais podem experimentar o modelo em Doubao, Jimeng AI e outras plataformas; usuários corporativos podem acessar o serviço do modelo profissional Seedance 1.5 por meio da API Volcano Engine a partir de 23 de dezembro.
Tan Dai destacou que a arquitetura tradicional de TI não pode mais atender às necessidades da era dos Agentes. A arquitetura nativa da nuvem de IA centrada no modelo está tomando forma e sendo reconstruída em torno do desenvolvimento e operação de Agentes.
No nível de desenvolvimento de agentes, o Volcano Engine atualizou de forma abrangente a plataforma de agente de IA de nível empresarial AgentKit. A plataforma cobre todo o ciclo de vida do Agente, desde o desenvolvimento, implantação até o gerenciamento e controle, e visa resolver os principais desafios enfrentados pelas empresas na implementação do Agente, como gerenciamento de direitos de identidade, segurança de modelo e integração de sistemas.
Além disso, a fim de reduzir o limite para uso empresarial, o Volcano Engine lançou o primeiro "Plano de Economia de IA" da indústria. Este plano cobre todos os produtos de grande porte que exigem preços pré-pagos e ajuda as empresas a economizar até 47% dos custos por meio de descontos diferenciados.
