De acordo com notícias de 12 de dezembro, xAI, uma startup de inteligência artificial de propriedade do CEO da Tesla e da SpaceX, Elon Musk, lançou recentemente seu robô de bate-papo Grok, mas algo parece ter dado errado. Na sexta-feira, o testador de segurança Jax Winterbourne postou uma captura de tela na plataforma de mídia social
Isso despertou a curiosidade das pessoas porque o Grok não foi desenvolvido pela OpenAI e as duas partes ainda são concorrentes.
O que é ainda mais interessante é que o pessoal da xAI não negou que esse comportamento ocorreu em seus modelos de IA. Igor Babuschkin escreveu em sua resposta: "O problema é que quando estávamos treinando Grok, a rede estava cheia de saídas ChatGPT e acidentalmente usamos algumas delas. Também ficamos muito surpresos quando notamos esse problema pela primeira vez. De qualquer forma, esse problema é muito raro e agora que estamos cientes disso, garantiremos que versões futuras do Grok não tenham esse problema. Não se preocupe, nenhum código OpenAI foi usado para desenvolver o Grok. "
Em resposta a Babushkin, Winterbourne escreveu: "Obrigado pela sua resposta. Direi que esta situação não é incomum e acontece com frequência quando se trata de criação de código. Mesmo assim, deixarei para aqueles que se especializam em grandes modelos de linguagem e inteligência artificial discutirem isso mais detalhadamente. Afinal, sou apenas um leigo."
Para muitos especialistas, porém, a explicação de Babushkin não parecia convincente. Grandes modelos de linguagem normalmente não divulgam seus dados de treinamento literalmente, e seria compreensível se Grok mencionasse as políticas da OpenAI online. Recusar-se a responder com base na política da OpenAI pode exigir formação especializada. A razão mais provável para isso acontecer é que Grok ajustou os dados de saída do modelo de linguagem grande OpenAI.
O pesquisador de IA Simon Willison disse em uma entrevista: "Estou um pouco cético sobre isso. Grok está se comportando assim só porque a Internet está inundada com conteúdo gerado pelo ChatGPT? Já vi muitos modelos de peso aberto no HuggingFace exibindo o mesmo comportamento, como Eles também são iguais ao ChatGPT. Isso ocorre porque esses modelos são ajustados em conjuntos de dados gerados usando OpenAIAPI ou usando conjuntos de dados gerados pelo próprio ChatGPT. Eu acho que sim é mais provável que Grok esteja sintonizado no conjunto de dados que contém a saída do ChatGPT, em vez de um acidente baseado em dados de rede.”
À medida que os grandes modelos de linguagem da OpenAI se tornam cada vez mais poderosos, tornou-se cada vez mais comum que alguns projectos de inteligência artificial (especialmente projectos de código aberto) utilizem dados sintéticos gerados por outros grandes modelos de linguagem para afinar a saída dos seus próprios modelos de inteligência artificial. O ajuste fino do comportamento de um modelo de IA pode servir a propósitos específicos, como melhorar os recursos de codificação após um treinamento inicial. Em março deste ano, um grupo de pesquisadores da Universidade de Stanford causou polêmica ao usar o resultado do modelo GPT-3 da OpenAI (denominado Text-DaVinci-003) para ajustar o rastreamento de instruções.
Online, podemos encontrar facilmente vários conjuntos de dados de código aberto que os pesquisadores coletaram dos resultados do ChatGPT. Portanto, o xAI pode ter ajustado o Grok usando um dos conjuntos de dados para atingir alguns objetivos específicos. Essa prática é tão comum que existe até um artigo intitulado "Como usar o ChatGPT para criar um conjunto de dados" no site WikiHow, um guia de vida em estilo de enciclopédia.
Esta é uma forma de, no futuro, utilizar ferramentas de inteligência artificial para construir ferramentas de inteligência artificial mais complexas, tal como as pessoas começaram a utilizar microcomputadores para conceber microprocessadores que eram mais complexos do que desenhos em papel e lápis. No entanto, o xAI poderá evitar isso no futuro, filtrando os dados de treinamento com mais cuidado.
Embora o empréstimo do trabalho de terceiros possa ser comum na comunidade de aprendizado de máquina (embora isso geralmente seja contra os termos de serviço), esse incidente intensificou a competição entre OpenAI e xAI, que remonta até mesmo às críticas anteriores de Musk ao OpenAI. À medida que se espalhava a notícia de que Grok poderia pegar emprestado dados do modelo OpenAI, a conta oficial do ChatGPT até postou uma postagem zombando do xAI, dizendo: “Temos muito em comum” e citando a postagem de Winterbourne. Musk respondeu: “Você coleta todos os dados de treinamento desta plataforma, você deveria saber disso!”