O Google lançou recentemente uma grande atualização para seu chatbot Gemini: depois que os usuários fazem perguntas, o sistema pode não apenas responder com texto, mas também gerar diretamente modelos 3D interativos e cenas de simulação física. Isso significa que quando os usuários desejam “ver um problema”, o Gemini agora pode fazê-lo por meio de uma visualização 3D rotativa e escalável com controle de parâmetros.

Segundo o Google, após habilitar novos recursos, o Gemini disponibilizará múltiplos métodos de interação ao mesmo tempo na geração de modelos ou simulações 3D. Os usuários podem não apenas arrastar para girar o modelo e ampliar os detalhes, mas também ajustar manualmente as variáveis por meio de controles deslizantes ou inserir valores diferentes para observar as alterações em tempo real. Para questões que envolvem processos físicos ou conceitos abstratos, espera-se que este tipo de visualização interativa se torne um novo tipo de formulário de resposta.
Na experiência real, o repórter utilizou "a geração de uma simulação da lua orbitando a Terra" como exemplo para teste. Gemini então gera uma cena visual tridimensional: os usuários podem ajustar a velocidade de revolução da lua com controles deslizantes, ocultar ou mostrar as linhas de trajetória que representam a órbita com interruptores e pausar ou continuar a demonstração com botões. Ao mesmo tempo, os usuários também podem ampliar e girar todo o conjunto de modelos 3D para observar o processo de movimento de diferentes perspectivas.
Antes disso, o Gemini suportava a geração de imagens planas interativas com base nas solicitações do usuário, mas ainda estava limitado à interação no nível da imagem. Esta atualização amplia os recursos para modelos 3D e simulações dinâmicas, enriquecendo ainda mais os meios para compreensão e apresentação de conceitos complexos assistida por IA. Esta atualização também ocorre em meio à competição entre grandes fornecedores de modelos por “respostas visuais”: não muito tempo atrás, a Anthropic introduziu a capacidade de gerar automaticamente gráficos, esquemas e outras visualizações interativas para Claude, enquanto a OpenAI também adicionou ferramentas de visualização para conceitos matemáticos e científicos ao ChatGPT.
Atualmente, todos os usuários do aplicativo Gemini podem experimentar esse novo recurso selecionando o modelo “Pro”. O caminho da operação é: mudar o modelo para Pro no aplicativo e, em seguida, fazer solicitações ao Gemini como “Mostrar um sistema de pêndulo duplo” e “Ajude-me a visualizar o efeito Doppler”. Depois que o Gemini retornar a descrição do texto, um botão “Mostre-me a visualização” aparecerá na parte inferior da interface. Clique nele para gerar o modelo 3D ou cena de simulação correspondente.