O Google lançou recentemente uma grande atualização para seu chatbot Gemini: depois que os usuários fazem perguntas, o sistema pode não apenas responder com texto, mas também gerar diretamente modelos 3D interativos e cenas de simulação física. Isso significa que quando os usuários desejam “ver um problema”, o Gemini agora pode fazê-lo por meio de uma visualização 3D rotativa e escalável com controle de parâmetros.

Segundo o Google, após habilitar novos recursos, o Gemini disponibilizará múltiplos métodos de interação ao mesmo tempo na geração de modelos ou simulações 3D. Os usuários podem não apenas arrastar para girar o modelo e ampliar os detalhes, mas também ajustar manualmente as variáveis ​​​​por meio de controles deslizantes ou inserir valores diferentes para observar as alterações em tempo real. Para questões que envolvem processos físicos ou conceitos abstratos, espera-se que este tipo de visualização interativa se torne um novo tipo de formulário de resposta.

Na experiência real, o repórter utilizou "a geração de uma simulação da lua orbitando a Terra" como exemplo para teste. Gemini então gera uma cena visual tridimensional: os usuários podem ajustar a velocidade de revolução da lua com controles deslizantes, ocultar ou mostrar as linhas de trajetória que representam a órbita com interruptores e pausar ou continuar a demonstração com botões. Ao mesmo tempo, os usuários também podem ampliar e girar todo o conjunto de modelos 3D para observar o processo de movimento de diferentes perspectivas.

Antes disso, o Gemini suportava a geração de imagens planas interativas com base nas solicitações do usuário, mas ainda estava limitado à interação no nível da imagem. Esta atualização amplia os recursos para modelos 3D e simulações dinâmicas, enriquecendo ainda mais os meios para compreensão e apresentação de conceitos complexos assistida por IA. Esta atualização também ocorre em meio à competição entre grandes fornecedores de modelos por “respostas visuais”: não muito tempo atrás, a Anthropic introduziu a capacidade de gerar automaticamente gráficos, esquemas e outras visualizações interativas para Claude, enquanto a OpenAI também adicionou ferramentas de visualização para conceitos matemáticos e científicos ao ChatGPT.

Atualmente, todos os usuários do aplicativo Gemini podem experimentar esse novo recurso selecionando o modelo “Pro”. O caminho da operação é: mudar o modelo para Pro no aplicativo e, em seguida, fazer solicitações ao Gemini como “Mostrar um sistema de pêndulo duplo” e “Ajude-me a visualizar o efeito Doppler”. Depois que o Gemini retornar a descrição do texto, um botão “Mostre-me a visualização” aparecerá na parte inferior da interface. Clique nele para gerar o modelo 3D ou cena de simulação correspondente.