O Toyota Research Institute (TRI) usou inteligência artificial generativa no “Robotic Kindergarten” para ensinar robôs a preparar o café da manhã – ou pelo menos as tarefas individuais necessárias para preparar o café da manhã – sem exigir centenas de horas de programação e correção de bugs. Em vez disso, os pesquisadores conseguiram isso em pouco tempo, dando aos robôs uma sensação de tato, conectando-os a um modelo de inteligência artificial e, em seguida, ensinando-lhes o que fazer, exatamente como fariam com um ser humano.

Os pesquisadores dizem que o toque é “um facilitador fundamental”. Ao fazer com que o robô estenda o polegar macio que você vê no vídeo abaixo (palavras minhas, não deles), o modelo pode “sentir” o que está fazendo, permitindo-lhe obter mais informações. Isso torna tarefas difíceis mais fáceis de realizar do que apenas à vista.

“É emocionante vê-los interagindo com o ambiente”, disse Ben Burchfiel, gerente do hábil departamento de operações do laboratório. Primeiro, um “professor” demonstra um conjunto de habilidades e depois, “durante algumas horas”, o modelo aprende em segundo plano. “Muitas vezes ensinamos um robô à tarde, deixamos que ele aprenda durante a noite e depois vemos seu novo comportamento na manhã seguinte”, acrescentou.

Os pesquisadores dizem que estão tentando criar “Grandes Modelos de Comportamento” (LargeBehaviorModels), ou LBMs, para robôs. "Semelhante à forma como os LLMs são treinados registrando padrões de escrita humana, os LBMs da Toyota aprenderão por meio da observação e depois" generalizarão, executando uma nova habilidade que nunca lhes foi ensinada ", disse Russ Tedrake, professor de robótica no MIT e vice-presidente de pesquisa robótica no TRI.

Usando esse processo, os pesquisadores afirmam ter treinado mais de 60 habilidades desafiadoras, como “derramar líquidos, usar ferramentas e manipular objetos deformáveis”. Eles esperam aumentar esse número para 1.000 até o final de 2024.

Google e Tesla têm conduzido pesquisas semelhantes com seu RoboticTransformerRT-2. Semelhante à abordagem dos pesquisadores da Toyota, seu robô usa sua própria experiência para inferir como fazer as coisas. Em teoria, os robôs treinados em IA poderiam eventualmente executar tarefas quase sem instruções, além de dar a um humano uma instrução geral (como “limpar um derramamento”).

Mas, como observou o The New York Times ao reportar sobre a pesquisa do gigante das buscas, os bots do Google pelo menos ainda têm um longo caminho a percorrer. Esse tipo de trabalho costuma ser “lento e trabalhoso”, e fornecer dados de treinamento suficientes é muito mais difícil do que alimentar um modelo de IA com grandes quantidades de dados baixados da Internet.