Descobriu-se que o ChatGPT tem problemas de vazamento de dados desde abril deste ano. Os invasores podem usar a renderização de Markdown de imagem durante ataques de injeção imediata. Como a OPENAI não realiza a verificação necessária, os invasores podem obter o conteúdo da sessão do usuário e enviá-lo para um servidor de terceiros.

De acordo com notícias divulgadas pelo pesquisador de segurança wunderwuzzi, a OPENAI começou a reparar esses problemas, mas não é um reparo completo, mas um plano de mitigação foi implantado.

A solução de mitigação atualmente implementada só é aplicável à versão web do ChatGPT. Quando o servidor retornar uma tag de imagem com um hiperlink, o ChatGPT chamará a API de verificação antes de exibir a imagem. A chamada é um endpoint chamado url_safe e anexa o URL de destino como um parâmetro de consulta. Na verdade, ele retornará um resultado falso, ou seja, não renderizará a imagem e enviará nenhum dado ao servidor do invasor.

No entanto, esta solução de mitigação não está completa. Os testes mostram que às vezes outras imagens de qualquer domínio ainda serão renderizadas, e o ChatGPT realizará consultas de rede na imagem, como verificar se a imagem existe através da pesquisa do Bing, verificar se ela possui funções de rastreamento ou outras funções.

Após análise, os pesquisadores descobriram que existem maneiras de continuar enviando dados, como dividir o texto em caracteres individuais e criar solicitações para cada caractere, o que também pode roubar dados, mas é extremamente ineficiente e muito lento.

É claro que agora que a OPENAI começou a lidar com este problema, mais medidas serão naturalmente implementadas mais tarde, mas pode levar mais tempo para resolver completamente este problema.