No Fórum de Cientistas Tengchong de 2025, Wang Xingxing, fundador da Yushu Technology, deu uma explicação detalhada da lógica "antropomórfica" e dos desafios práticos por trás do desenvolvimento de robôs humanóides.Wang Xingxing disse: “As pessoas gostam de robôs que se parecem com humanos”. A realidade é que quanto mais bonitos e humanos forem os robôs, mais os consumidores estarão dispostos a pagar por eles.
Ele também mencionou que a tecnologia atual de IA é altamente dependente de dados, e a qualidade dos dados determina diretamente o limite superior das capacidades de IA. No que diz respeito aos robôs humanóides, dados de ação e comportamento de alta qualidade e em grande escala ainda são escassos.
Wang Xingxing mostrou aos participantes o progresso da Tecnologia Yushu neste campo:Ao coletar antecipadamente dados de movimento de pessoas reais e treinar em um ambiente de IA, os robôs podem reproduzir os diversos movimentos dos humanos, percebendo que “os robôs se movem conforme os humanos se movem”.
Wang Xingxing também admitiu que os atuais modelos de IA no campo da inteligência incorporada ainda são insuficientes. "O estágio atual é semelhante ao estado de um a três anos antes do advento do ChatGPT - a direção é clara, mas os resultados inovadores ainda não foram totalmente revelados."
Ele pensa,Se um robô pode completar cerca de 80% das tarefas através de instruções de linguagem ou texto em 80% das cenas desconhecidas da vida cotidiana, isso pode ser considerado um "momento GPT" no campo da inteligência incorporada.Atualmente, os robôs têm um bom desempenho em uma única tarefa, mas uma vez que o objeto ou ambiente muda, especialmente quando confrontados com a superposição de múltiplas tarefas, a taxa de sucesso cairá significativamente, o que reflete as deficiências do robô nas capacidades de generalização e raciocínio.
Por fim, Wang Xingxing revelou: "Talvez eu não precise estar presente pessoalmente no Fórum de Cientistas de Tengchong do próximo ano. Posso enviar um robô para participar da reunião em meu nome. Posso controlá-lo remotamente de Hangzhou e deixá-lo sincronizar minha linguagem e movimentos para obter interação em tempo real. Esta tecnologia já é viável e espera-se que seja colocada em aplicação prática no próximo ano".
