A Amazon revelou na segunda-feira o NovaAct, um agente de IA de uso geral que pode controlar um navegador da web e realizar algumas ações simples de forma independente. Além do novo modelo de IA de agente, a Amazon também lançou o NovaActSDK, um kit de ferramentas que permite aos desenvolvedores construir protótipos de agentes usando o NovaAct.

Desenvolvido no recém-inaugurado AGI Labs da Amazon em São Francisco, o NovaAct também fornecerá funcionalidades importantes para a próxima atualização da empresa para Alexa+, um aprimoramento generativo de IA para o popular assistente de voz da Amazon. Porém, a versão do NovaAct disponível a partir de hoje é um pouco inferior. A Amazon chama isso de prévia da pesquisa.

Os desenvolvedores podem acessar o kit de ferramentas NovaAct através do novo site nova.amazon.com, que também serve como vitrine para os vários modelos básicos Nova da Amazon.

NovaAct é a tentativa da Amazon de alavancar sua própria tecnologia geral de agente de inteligência artificial para competir com o Operador da OpenAI e o ComputerUse da Anthropic. Várias empresas líderes de tecnologia acreditam que os agentes de IA capazes de navegar na web para os usuários tornarão os chatbots de IA de hoje mais úteis.

A Amazon pode não ser a primeira a desenvolver este tipo de tecnologia de agente, mas com Alexa+, seu alcance pode ser o mais amplo.

A Amazon diz que os desenvolvedores que desenvolvem com o SDK NovaAct devem ser capazes de automatizar ações básicas em nome dos usuários, como pedir uma salada na Sweetgreen ou fazer uma reserva para um jantar. Com o kit de ferramentas NovaAct, os desenvolvedores podem integrar ferramentas que permitem aos agentes de IA navegar na web, preencher formulários ou selecionar datas em um calendário.

A Amazon afirma que o NovaAct superou os agentes da OpenAI e da Anthropic em diversos testes dentro da empresa. Por exemplo, no ScreenSpot WebText, que mede como um agente de IA interage com o texto na tela, o NovaAct obteve 94%, melhor que o CUA da OpenAI (pontuação de 88%) e o Claude3.7Sonnet da Anthropic (90%).

No entanto, a Amazon não comparou o NovaAct usando avaliações de proxy mais comuns, como o WebVoyager.

NovaAct é o primeiro produto público lançado pelo laboratório AGI da Amazon mencionado acima. O projeto é co-liderado pelos ex-pesquisadores da OpenAI David Luan e Pieter Abbeel. Ambos já fundaram suas próprias startups – Luan fundou a Adept, enquanto Abbeel cofundou a Covariant – e a Amazon os contratou no ano passado para liderar seus esforços de agentes de IA.

Embora possa parecer estranho que a AGI Labs desenvolva um agente de IA capaz de encomendar SweetGreen, Luan acredita que os agentes são um passo crítico na criação de sistemas de IA superinteligentes. Luan define AGI como “um sistema de IA que pode ajudá-lo a fazer tudo o que um ser humano faz em um computador”.

Luan disse que sua equipe projetou o NovaActSDK para automatizar tarefas curtas de maneira confiável e fornecer aos desenvolvedores ferramentas que lhes permitem definir com precisão quando a intervenção humana é necessária nos fluxos de trabalho dos agentes. Isto, espera ele, permitirá aos desenvolvedores criar aplicações proxy mais confiáveis, embora não necessariamente totalmente autônomas.

A Amazon lançou seu primeiro agente geral de inteligência artificial em um mercado lotado, mas é uma tecnologia-chave na qual a empresa tem grandes esperanças. Os primeiros testes do NovaAct oferecem um vislumbre de algumas das capacidades do tão adiado Alexa+, marcando um momento decisivo para os esforços de inteligência artificial da Amazon.

O principal problema com os primeiros agentes de IA da OpenAI, Google e Anthropic é sua confiabilidade em diferentes domínios. Nos testes do TechCrunch, esses sistemas eram lentos, difíceis de operar de forma independente por longos períodos de tempo e propensos a cometer erros que os humanos não cometeriam. Em breve veremos se a Amazon decifrou o código – ou se seus agentes sofrem das mesmas falhas que atormentaram seus concorrentes.