Na véspera do Ano Novo Lunar, o Google veio diretamente com uma grande votação:Bard será chamado coletivamente de Gêmeos de agora em diante. Através do GeminiAdvanced, você pode acessar o GeminiUltra, o modelo grande multimodal nativo mais poderoso do Google!Em dezembro do ano passado, o Google lançou o GeminiPro e o GeminiNano, que as pessoas podem usar gratuitamente por meio dos telefones celulares das séries Bard, Pixel8Pro e Samsung S24 do chatbot. Hoje, a Bard mudou sua aparência, trazendo uma nova experiência da versão de associação GeminiAdvanced com copo ultragrande Ultra1.0, e também lançando aplicativos móveis que suportam clientes Android e iOS.
O preço da assinatura do novo serviço é de US$ 19,99 por mês, que é semelhante ao preço de US$ 20 por mês para aplicativos convencionais de IA generativa, como ChatGPTPlus e PerplexityPro. No entanto, para mostrar sinceridade, o Google oferecerá um teste gratuito durante os primeiros dois meses.
O grande modelo multimodal de maior ordem do Google, GeminiUltra abre uma nova era
De acordo com o CEO do Google, Sundar Pichai, o Ultra1.0 é o primeiro modelo a superar os especialistas humanos em MMLU (compreensão massiva de linguagem multitarefa), usando 57 combinações de disciplinas, incluindo matemática, física, história, direito, medicina e ética para testar conhecimentos e habilidades de resolução de problemas.
Como resultado, o GeminiAdvanced será ainda mais poderoso em tarefas altamente complexas, como codificação, raciocínio lógico, seguimento de instruções sutis e colaboração em projetos criativos. Você não apenas pode ter conversas mais longas e detalhadas com seus usuários, mas também pode entender melhor o contexto do prompt.
Por exemplo: GeminiAdvanced pode se tornar um tutor pessoal, criando instruções passo a passo, questionários personalizados ou respostas adaptadas ao seu estilo de aprendizagem; resolver cenários de codificação mais complexos e ajudar a avaliar diferentes ideias de programação; torne-se um parceiro criativo para criadores digitais, gere novos conteúdos, analise as últimas tendências e desenvolva planos de negócios. Vale ressaltar que todas as imagens geradas pelo Imagen2 dentro do GeminiUltra possuem marca d'água digital aplicada (embora você não consiga vê-la).
À medida que novos recursos são adicionados, os usuários experimentarão maiores capacidades multimodais, capacidades de programação mais interativas e análises de dados mais profundas. Atualmente o GeminiAdvanced suporta apenas o inglês e pode ser usado em mais de 150 países e regiões, e será gradualmente expandido para mais idiomas.
Versões móveis Android e IOS estão disponíveis, Gmail, documentos e formulários podem ser usados
GeminiAdvanced, como parte do novo plano avançado GoogleOneAI, também fornecerá aos usuários 2 TB de espaço de armazenamento. Além disso, em breve os assinantes do AI Premium poderão ligar para o Gemini Ultra do Gmail, Docs, Slides, Sheets e outros aplicativos que foram anteriormente agregados como DuetAI.
Para facilitar o acesso em celulares, desta vez o Google lançou um novo aplicativo Gemini.
Você pode tirar uma foto de um pneu de carro e solicitar uma legenda, gerar uma imagem personalizada para um convite para jantar ou solicitar que uma mensagem de texto complexa seja escrita. O Google chama isso de “um primeiro passo importante na construção de um verdadeiro assistente de IA – uma nova classe de assistente prático, conversacional e multimodal”.
Os usuários de telefones Android podem baixar o aplicativo Gemini ou ativar o Google Assistant da mesma maneira que fariam normalmente – como dizer “Ei, Google” para ativá-lo. Gemini pode gerar uma descrição da foto que você acabou de tirar e responder perguntas sobre o artigo que você está lendo. Muitos dos recursos de voz do Google Assistant também estarão disponíveis por meio do aplicativo Gemini, incluindo configuração de temporizadores, realização de chamadas e controle de dispositivos domésticos inteligentes.
Embora o aplicativo iOS ainda esteja a caminho, o Google disse que estará disponível na App Store nas próximas semanas.
Expanda os recursos do Gemini para mais produtos
O Gemini também será usado em todos os produtos que indivíduos e empresas usam todos os dias, incluindo Workspace e serviços Google Cloud.
Espaço de trabalho:
Pichai disse que mais de 1 milhão de pessoas estão atualmente usando recursos como “Helpmewrite” para aumentar a produtividade e a criatividade por meio do DuetAI. A partir de hoje, o DuetAI será alterado para Gemini for Workspace e, em breve, os assinantes do plano premium GoogleOneAI poderão usar o GeminiUltra no pacote completo do Google Office: Gmail, Docs, Sheets, Slides e Meet.
Google Nuvem:
Para clientes de nuvem, o Gemini ajudará a aumentar a produtividade empresarial, auxiliará os desenvolvedores a escrever códigos com mais eficiência e protegerá as organizações contra ataques cibernéticos.
Os desenvolvedores têm sido a base de todas as grandes mudanças tecnológicas e desempenham um papel igualmente importante no ecossistema Gemini. Centenas de milhares de técnicos e empresas estão agora usando grandes modelos Gemini para desenvolvimento. O Google compartilhará mais detalhes sobre benefícios futuros para desenvolvedores e clientes da nuvem na próxima semana.
Pichai também revelou que o Google já está treinando ativamente a próxima geração do modelo Gemini.
Os internautas mal podem esperar, GeminiUltra foi lançado recentemente para testes
Quando o Google lançou o GeminiPro em 6 de dezembro do ano passado, ele tinha como alvo o GPT-3.5. Devido ao cancelamento da estreia offline planejada, a série Gemini foi ofuscada pela mídia. Então, em poucos dias, os copos médios e grandes apareceram repentinamente juntos e desencadearam discussões acaloradas e repressões online contra a falsificação com um chocante vídeo de demonstração de "pato". Naquela época, o Google anunciou que o GeminiUltra havia ultrapassado o nível mais avançado da indústria representado pelo ChatGPT em 30 dos 32 testes de benchmark amplamente utilizados pelo LLM.
Agora você pode finalmente colocar as mãos nele e descobrir o quão poderosa é a versão Ultra.
Teste a geração de conteúdo escrevendo um LinkedInPost. A conclusão é que o GeminiUltra vence o GPT-4 e se torna o vencedor absoluto com mais opções de títulos, tempos de resposta mais rápidos e “sem expressões estúpidas de emoji”.
A Netizen Alphabetting surgiu com uma questão de raciocínio lógico: Tabitha gosta de biscoitos, mas não de bolos, gosta de carneiro, mas não de cordeiro, e gosta de quiabo, mas não de abóboras. Pergunta, seguindo as mesmas regras, se Tabitha prefere cerejas ou peras.
GeminiUltra sugere: "Tabitha gosta de alimentos com duas sílabas e não gosta de alimentos com uma sílaba." Ele lista o número de sílabas de cada alimento do quebra-cabeça e, como “cerejas” tem duas sílabas, a resposta é cerejas.
GPT-4 acredita que a preferência de Tabitha pode estar relacionada à última letra da palavra. A comida que ela gosta termina em consoante, e a comida que ela não gosta termina em causa. Nesse caso, tanto as cerejas quanto as peras se qualificam - um pouco complicado, mas se você tiver que escolher uma, que sejam as cerejas.
Ele disse que o GeminiUltra resolveu com sucesso o teste lógico que foi fragmentado pelo GPT-4.
O usuário Brett Winton testou a função de desenho vicentino de ambos, e a solicitação foi “Gerar uma imagem de um pintor tentando desenhar uma natureza morta na parte externa do foguete para torná-lo engraçado, uma ilustração”. À esquerda está o GPT-4, à direita está o GeminiUltra.
A imaginação do modelo de IA é uma questão de opinião, mas o pintor na imagem de Gêmeos parece mais comer do que pintar, e os detalhes de suas mãos também são um pouco problemáticos. Todos os comentários acham que o GPT-4 é melhor.
Ele então comparou as capacidades de cálculo do GeminiUltra, Claude e GPT-3.5 para problemas de matemática da 8ª série.
A questão é: Garcia está planejando uma festa de pizza. Ela precisa garantir que 30 alunos recebam pelo menos 3 fatias cada e que cada pizza tenha 8 fatias. Para maior variedade, Garcia decidiu pedir meia pizza de queijo e meia pizza de linguiça. Porém, 5 alunos são vegetarianos e só comem pizza de queijo.
Por favor responda:
1.Quantas pizzas o Garcia precisa pedir para garantir pelo menos 3 fatias para cada aluno?
2. Quantas pizzas de cada tipo tem?
3. Se cada pizza custa $12, qual é o custo total do pedido?
Em testes anteriores, o GeminiPro errou nessa questão. Desta vez, o Ultra respondeu corretamente com um total de 12 pizzas e um custo de US$ 144. Mas a resposta correta para a pergunta 2 deveria ser 6 de cada tipo de pizza, e o Ultra falhou.
Brett Winton disse que o GeminiUltra, assim como Claude, não é tão preciso em cálculos matemáticos quanto o GPT-3.5.
Em termos de capacidade de codificação, o internauta Mervin Praison criou com sucesso um jogo de cobra usando Python no GeminiUltra.
Para casos de uso mais detalhados, você pode aproveitar a avaliação gratuita de dois meses e experimentar você mesmo.
OpenAI abre um novo campo de batalha para agentes de IA, e o Google não está disposto a ficar para trás
Sissie Hsiao, vice-presidente e gerente geral de experiência Gemini e Google Assistant do Google, disse: "Para o Google, Gemini é mais do que um modelo. Na verdade, é uma transformação de como pensamos sobre a tecnologia mais avançada e todo o ecossistema que construímos sobre ela, desde produtos que impactam bilhões de usuários até a plataforma API que desenvolvedores e empresas usam para inovar".
Ainda ontem, The Information publicou um relatório intitulado “OpenAI está mudando o foco da competição de IA para software que pode operar equipamentos e automatizar tarefas”.
O artigo revelou queA OpenAI está desenvolvendo um software de agente que pode efetivamente assumir o controle de telefones celulares e computadores para executar tarefas complexas para os usuários.Você pode comandar o ChatGPT para realizar transferências de dados de documentos para formulários, automatizar relatórios de despesas a serem preenchidos e inseridos em software de contabilidade ou tarefas baseadas na web, como criar itinerários ou reservar voos dentro de um orçamento específico.
Com o lançamento de cada vez mais novos modelos de grande porte, a OpenAI também está ciente da possibilidade de este ano não ter mais o LLM mais poderoso do mercado. Portanto, prepare-se com antecedência para abrir novos campos de batalha.
Essas solicitações desencadeariam cliques de agentes, movimentos de cursor, entrada de texto e outras ações humanas, segundo pessoas familiarizadas com o assunto. Pode transformar o ChatGPT no que Sam Altman chama privadamente de “assistente de trabalho pessoal superinteligente” e também competirá mais diretamente com o Microsoft Copilot e o Google Gemini for Workspace.
No ano passado, o ChatGPT trouxe receitas de US$ 1,6 bilhão para a OpenAI, e a Microsoft também confiou na IA generativa para impulsionar significativamente seus últimos resultados financeiros trimestrais.
O negócio de IA ainda não trouxe um fluxo de caixa claro para o Google. Que tipo de feedback do mercado o lançamento das versões pagas Gemini Advanced e Ultra 1.0 trará? Os usuários que gastaram dinheiro para assinar o GPT mudarão para o Gemini? Qual é o novo visual definitivo da inteligência artificial integrada ao ecossistema do Google? Tudo isso é emocionante. Este ano está destinado a continuar a ser um cabo de guerra para a IA com clímax.