A Alphabet (controladora do Google) lançou o Gemini 3.1 Flash Live, um novo modelo de inteligência artificial especialmente desenvolvido para aplicações de áudio e vídeo em tempo real. A mudança sinaliza uma concorrência crescente no campo da IA ​​multimodal. O Google afirma que este é o melhor sistema de áudio e voz já construído. Este modelo foi projetado para fornecer uma experiência de conversação mais natural e respostas mais rápidas para produtos de consumo e empresariais. Esta versão é destinada a desenvolvedores, empresas e usuários comuns que desejam uma experiência interativa mais suave, baseada na voz.

O Google afirma que o Gemini 3.1 Flash Live é mais rápido que os modelos anteriores e pode dobrar a memória de contexto de conversação. Isso torna o modelo mais prático em cenários de conversas longas, como brainstorming, pesquisa em tempo real e trocas complexas de perguntas e respostas.

O modelo agora está integrado a vários produtos do Google, incluindo Gemini Live, recursos de pesquisa em tempo real, API Gemini Live no Google AI Studio e Gemini Enterprise. Esta ampla integração mostra que o Google está integrando sua mais recente tecnologia de IA em todo o ecossistema, em vez de apenas lançá-la como um produto independente.

Esta mudança é significativa porque as capacidades multimodais e de voz em tempo real estão a tornar-se campos de batalha importantes na IA, e as principais plataformas estão a correr para torná-las mais fáceis de utilizar e mais amplamente utilizadas nos negócios.