Pesquisadores da equipe de pesquisa básica de inteligência artificial da MetaPlatforms disseram hoje que lançarão uma versão mais avançada do Habitat, um ambiente de simulação de inteligência artificial usado para ensinar robôs como interagir com o mundo físico.
Junto com o lançamento do Habitat 3.0, a empresa também anunciou o lançamento do Habitat Synthetic Scenes Dataset, um conjunto de dados tridimensional de autoria de um artista que pode ser usado para treinar agentes de navegação de inteligência artificial; e HomeRobot, uma plataforma de software e hardware de assistente robótico acessível que pode ser usada em ambientes simulados e reais.
Os pesquisadores da FAIR explicaram em uma postagem no blog que os produtos recém-lançados representam seu progresso contínuo em “inteligência artificial incorporada”. Por “IA incorporada” entendem-se agentes de inteligência artificial capazes de detectar e interagir com o seu ambiente, partilhar de forma segura o ambiente com parceiros humanos e comunicar e ajudar parceiros humanos nos mundos digital e físico.
Habitat é um catálogo de ambientes virtuais, como escritórios, residências e armazéns, que pode ser usado para treinar e melhorar a capacidade de robôs de inteligência artificial de navegar no mundo real. O ambiente virtual é cuidadosamente construído usando um sistema de captura infravermelha que pode medir com precisão a forma e o tamanho de objetos como mesas, cadeiras e até livros. Nesses ambientes, os pesquisadores podem treinar robôs para realizar tarefas complexas e de várias etapas que exigem a capacidade do robô de ver e compreender o que está ao seu redor.
O Habitat 3.0 baseia-se nessas capacidades existentes, suportando robôs e avatares humanóides, permitindo que humanos e robôs colaborem em muitas tarefas diferentes. Por exemplo, humanos e robôs podem trabalhar juntos para limpar a sala ou preparar receitas na cozinha. FAIR disse que isso abre novas maneiras de estudar a colaboração entre humanos e robôs em várias tarefas do mundo real. FAIR afirmou que os avatares humanos no "Habitat 3.0" são muito realistas, com marchas e movimentos naturais, permitindo interações mais realistas de baixo e alto nível.
“Esta coexistência de humanos e robôs num ambiente simulado permite-nos, pela primeira vez, aprender estratégias de IA de robôs na presença de um avatar humanóide num ambiente doméstico e avaliar essas estratégias ao lado de pessoas reais durante as tarefas quotidianas”, escreveram os investigadores.
FAIR afirmou que o "Habitat 3.0" reduzirá o tempo de aprendizagem dos agentes robóticos de inteligência artificial de meses ou mesmo anos para alguns dias. Também permite testes mais rápidos de novos modelos em um ambiente de simulação seguro e sem qualquer risco.
O conjunto de dados de cenas sintéticas do Habitat, conhecido como HSSD-200, também ajudará a acelerar a pesquisa de IA, já que simulações tridimensionais de cenas do mundo real são essenciais para o treinamento. FAIR explica que o HSSD-200 supera seus conjuntos de dados anteriores porque as cenas tridimensionais refletem com mais precisão as do mundo físico do que antes. Consiste em 211 cenas 3D de alta qualidade que reproduzem casas e outros ambientes do mundo real e contém 18.656 modelos de objetos do mundo físico em 466 categorias semânticas.
De acordo com a FAIR, o HSSD-200 fornece classificação semântica refinada correspondente à ontologia WordNet, enquanto seus recursos de compactação de ativos permitem simulações de IA incorporadas de alto desempenho. Objetos individuais são criados por artistas 3D profissionais para corresponder com precisão a marcas de móveis e eletrodomésticos do mundo real em aparência e tamanho.
Por fim, FAIR apresenta uma nova biblioteca HomeRobot, uma especificação de hardware e software para pesquisadores que desejam criar robôs físicos para aplicar ao mundo físico os modelos que treinaram no Habitat.
O HomeRobot é baseado em uma pilha de software fácil de usar e componentes de hardware acessíveis, o que significa que é rápido e fácil de configurar e estar pronto para testes no mundo real. Ele foi projetado para pesquisa de manipulação móvel de vocabulário aberto, que é a capacidade de um robô pegar objetos e colocá-los em locais designados em qualquer ambiente invisível. Para fazer isso, os robôs devem ser capazes de sentir e compreender os novos cenários que encontram.
Holger Mueller, da Constellation Research Inc., disse que o anúncio da Meta mostra que a empresa está fazendo um progresso real além do hype da inteligência artificial generativa, com software poderoso que pode ser usado para treinar e testar robôs inteligentes em mundos virtuais. Ele disse: "O Habitat 3.0 agora está focado na interação humano-robô porque é um marco importante que deve ser aperfeiçoado se quisermos construir robôs que possam funcionar na vida diária. O conjunto de dados HSSD-200 é muito útil porque gerar objetos físicos nesses ambientes é caro e leva muito tempo."
FAIR disse que há muito mais por vir desses desenvolvimentos. O próximo passo na sua investigação contínua sobre IA incorporada centrar-se-á na forma como os robôs podem colaborar com os humanos em ambientes dinâmicos e em constante mudança que refletem o mundo real em que vivemos.
Os pesquisadores explicam: "Na próxima fase da pesquisa, usaremos o simulador Habitat 3.0 para treinar nossos modelos de inteligência artificial para que esses robôs possam ajudar parceiros humanos e se adaptar às suas preferências. Usaremos o HSSD-200 em conjunto com o Habitat 3.0 para coletar dados sobre interação e colaboração humano-robô em grande escala para treinar modelos mais poderosos. Vamos nos concentrar em implantar os modelos aprendidos nas simulações no mundo físico para medir melhor seu desempenho. "