Google lança modelos de inteligência artificial Gemini 3.5 Flash e Gemini Omni

Na I/O Developer Conference deste ano, o Google lançou oficialmente a nova geração de modelos da série Gemini 3.5 e a nova série Gemini Omni. O Gemini 3.5 Flash foi o primeiro a ser aberto ao público, enquanto o Gemini Omni se concentra na capacidade de “gerar vídeo a partir de qualquer entrada”.

O Gemini 3.5 Flash já está disponível para todos os usuários por meio do modo AI no aplicativo Gemini e na pesquisa do Google. O Google afirma que o modelo tem um nível de inteligência comparável aos grandes modelos emblemáticos em muitas dimensões, ao mesmo tempo que mantém o desempenho consistente de alta velocidade da série Flash.

De acordo com a introdução, Gemini 3.5 Flash é atualmente o agente Gemini e modelo de geração de código mais forte. Ele ainda supera o Gemini 3.1 Pro em testes de benchmark relacionados a códigos e agentes complexos, e mantém a liderança no entendimento multimodal, por isso também é definido como o modelo padrão atual. Os usuários podem chamar esse modelo diretamente em pesquisas diárias, conversas no aplicativo e outros cenários para obter respostas mais rápidas e inteligentes e suporte de código.

Gemini Omni, lançado ao mesmo tempo, representa a mais recente tentativa do Google na direção do vídeo generativo. Este novo modelo pode gerar vídeos a partir de qualquer entrada. Os usuários podem combinar livremente imagens, áudio, vídeos e texto como entrada, e o modelo gera conteúdo de vídeo de alta qualidade com base no conhecimento do mundo real do Gemini. Após a conclusão da geração, os usuários também podem realizar várias rodadas de edição de conversação por meio de linguagem natural para modificar e ajustar os detalhes do vídeo.

O primeiro modelo da série Gemini Omni é o Gemini Omni Flash, que suporta modificação parcial ou geral do vídeo e pode continuar a manter a coerência narrativa da cena original durante múltiplas rodadas de criação, permitindo aos usuários ajustar continuamente sem perder o enredo principal. O Google disse que este modelo tem uma compreensão mais intuitiva de conceitos físicos como gravidade, energia cinética e dinâmica de fluidos, permitindo gerar cenas dinâmicas mais realistas e confiáveis.

Em termos de experiência criativa, o Gemini Omni permite que os usuários utilizem suas próprias vozes e avatares para participar da criação de vídeos, gerando avatares digitais com características pessoais. A fim de lidar com as questões de rastreabilidade e segurança do conteúdo sintético, todos os vídeos gerados por este modelo serão incorporados com marcas d'água digitais SynthID para rotular e identificar o conteúdo gerado por IA.

Em termos de disponibilidade, o Gemini Omni Flash está disponível para assinantes globais a partir de hoje. Os usuários que assinam os planos Google AI Plus, Pro e Ultra podem usar o modelo diretamente no aplicativo Gemini e no Google Flow. Ao mesmo tempo, o Google também está introduzindo esse recurso gratuitamente no YouTube Shorts e no YouTube Create, permitindo que mais criadores experimentem a função de geração de vídeo baseada na tecnologia Gemini em plataformas de conteúdo convencionais.