Os pesquisadores descobrem que o ChatGPT pode vazar informações confidenciais ao repetir certas palavras

Uma equipe de pesquisadores do Google descobriu que o chatbot de inteligência artificial da OpenAI, ChatGPT, pode vazar informações confidenciais em seus dados de treinamento, como informações pessoais de pessoas reais. É relatado que ChatGPT é uma nova ferramenta de chatbot de IA lançada pela OpenAI em 30 de novembro de 2022. Ela pode gerar rapidamente artigos, histórias, letras, prosa, piadas e até códigos de acordo com as necessidades do usuário e responder a várias perguntas.

Apenas dois meses após seu lançamento, o ChatGPT atingiu 100 milhões de usuários ativos mensais, tornando-se um dos aplicativos de consumo que mais cresce na história. Na primeira OpenAI Developer Conference realizada em 6 de novembro deste ano, o CEO da OpenAI, Sam Altman, anunciou que o número de usuários ativos semanais do ChatGPT atingiu 100 milhões.

Como todos os chamados modelos de linguagem grande (LLMs), os modelos de aprendizado de máquina subjacentes que alimentam o ChatGPT são treinados usando grandes quantidades de dados extraídos da Internet. Mas, de forma preocupante, alguns dos dados de formação extraídos continham informações de identificação sobre pessoas reais, incluindo nomes, endereços de e-mail e números de telefone.

Os pesquisadores do Google encontraram uma maneira de fazer com que o ChatGPT revelasse alguns dos dados usados para treinamento, pedindo-lhe que repetisse certas palavras “para sempre”. Os dados incluíam informações privadas (por exemplo, nomes pessoais, e-mails, números de telefone, etc.), trechos de artigos de pesquisa e artigos de notícias, páginas da Wikipédia e muito mais.

Katherine Lee, cientista pesquisadora sênior do Google Brain, disse: "Descobrimos esta vulnerabilidade em julho e notificamos a OpenAI em 30 de agosto, e após o período de divulgação padrão de 90 dias, liberamos a vulnerabilidade. Agora que divulgamos isso à OpenAI, a situação pode ser diferente agora." Os pesquisadores disseram que a OpenAI corrigiu a vulnerabilidade em 30 de agosto.

A mídia estrangeira disse que a vulnerabilidade no ChatGPT descoberta pelos pesquisadores do Google levantou sérias preocupações de privacidade, especialmente para modelos treinados em conjuntos de dados contendo informações confidenciais.