A equipe de pesquisa inventou a doença ocular “bisxonimania” e vários chatbots de IA ecoaram it

Ao longo do último ano, se alguém inserir seus sintomas de “olhar para a tela por muito tempo, coceira nos olhos e pálpebras avermelhadas” em vários chatbots convencionais de inteligência artificial, o sistema provavelmente dará um diagnóstico estranho: uma nova doença chamada “bixonimania”. No entanto, esta chamada doença não existe na literatura médica oficial. Ele veio inteiramente de um experimento deliberadamente planejado pela equipe da pesquisadora médica Almira Osmanovic Thunström, da Universidade de Gotemburgo, na Suécia.

Em 15 de março de 2024, duas postagens de blog apresentando “bixonimania” apareceram pela primeira vez na plataforma Medium. Posteriormente, em 26 de abril e 6 de maio, dois preprints acadêmicos forjados foram carregados no site de rede social acadêmica SciProfiles. O autor assinado foi o inexistente "Lazljiv Izgubljenovic", e os avatares também foram gerados por IA. "Asteria Horizon University" e "Nova City, California", onde as obras do autor fictício também são fictícias. Mesmo a "Starfleet Academy", "Enterprise", "Professor Sideshow Bob Foundation", "Fellowship of the Ring University", "Galactic Triad" e outras instituições mencionadas nos agradecimentos do artigo são todas provenientes de obras de ficção científica e personagens de desenhos animados, e as dicas são extremamente óbvias. O texto do artigo contém palavras como “todo o artigo é fabricado” e “50 sujeitos fictícios foram recrutados” logo no início, quase anunciando a quem estiver interessado que “isso é uma piada”.

Osmanovich Tongström disse que originalmente concebeu este experimento para explicar aos alunos como grandes modelos de linguagem podem construir conhecimento a partir de "conjuntos de dados de rastreamento comuns" na Internet (como rastreamento comum) e para mostrar como a "injeção imediata" pode "abduzir" chatbots de fora da proteção de segurança. Com base em sua formação médica, ela escolheu um tema relacionado à saúde e usou deliberadamente um nome "que soava engraçado", bixonimania, para enfatizar sua natureza ficcional - qualquer médico que visse o nome de uma doença ocular terminando em mania saberia que algo estava errado, já que é um termo psiquiátrico.

No entanto, o experimento “foi longe demais”. Poucas semanas após o upload das informações, o Copiloto do Bing da Microsoft descreveu a bixonimania como uma “doença real e rara”, enquanto o Google Gemini a chamou de “doença causada pela superexposição à luz azul” e recomendou que os usuários consultassem um oftalmologista. Durante o mesmo período, a Perplexity AI forneceu uma “taxa de prevalência” específica de cerca de 1 por 90.000 pessoas, e o ChatGPT da OpenAI determinará se os sintomas são consistentes com a bixonimania com base na descrição do usuário. Entre essas respostas, há usuários que perguntam diretamente sobre a bixonimania, e também há perguntas gerais que descrevem apenas "a luz azul causa pigmentação das pálpebras", e o modelo irá conectá-las ativamente a esse nome fictício da doença.

As respostas chocaram alguns especialistas. Alex Ruani, investigador sobre desinformação em saúde na University College London, destacou que se o sistema científico e os sistemas que o apoiam não conseguirem identificar e filtrar esse “lixo”, as consequências serão desastrosas. Ela chamou o caso de “um exemplo clássico de como funcionam a desinformação e a desinformação” e enfatizou que “pode parecer engraçado, mas o problema é muito sério”.

Informações falsas na Internet não são um problema novo. Mecanismos de busca como o Google continuaram a lutar contra “conteúdo falso” e “conteúdo enganoso” por muitos anos, filtrando informações ruins por meio da atualização de algoritmos de classificação. No entanto, ao contrário da pesquisa tradicional, os grandes modelos generativos apresentam deficiências naturais na triagem e rastreabilidade da informação e muitas vezes "inventam sérios disparates" quando falta uma base fiável. Desde o surgimento destes artigos falsos, algumas das versões mais recentes de grandes modelos aprenderam a expressar ceticismo quando confrontados com a bixonimania, como em 11 de março de 2026, quando o ChatGPT apontou passivamente que o termo "provavelmente é um rótulo pseudocientífico falso ou limítrofe". Mas apenas alguns dias depois, descreveu a bixonimania como “um novo subtipo de melanose periorbital associada à exposição à luz azul de telas digitais” em outra rodada de perguntas e respostas.

Oscilações semelhantes ocorrem em outros sistemas. Em meados de março deste ano, o Microsoft Copilot responderá que a bixonimania “ainda não é amplamente reconhecida como um diagnóstico médico, mas vários artigos e relatos de casos recentemente publicados a consideram uma doença benigna mal diagnosticada, relacionada à exposição prolongada à luz azul”. Em janeiro, a Perplexity o descreveu como “um termo emergente” em sua descrição. Depois de questionadas as declarações relevantes, várias empresas responderam sucessivamente: A Perplexity afirmou que a sua “maior vantagem é a precisão”. Embora não tenha afirmado ser “100% preciso”, afirmou ser “a empresa de IA que mais valoriza a precisão”; OpenAI afirmou que o modelo que suporta a versão atual do ChatGPT foi significativamente melhorado no fornecimento de informações médicas seguras e precisas. Pesquisas anteriores refletiram a situação do modelo da velha geração. Questionado sobre a resposta anterior da Gemini em relação à bixonimania como uma doença real, um porta-voz do Google disse que isso refletia o desempenho dos primeiros modelos e enfatizou que a empresa tem sido “franca sobre as limitações da IA generativa”, solicitando aos usuários do aplicativo que “verifiquem as informações” e recomendando que os usuários consultem profissionais quando se trata de tópicos delicados, como cuidados médicos. A Microsoft não respondeu a um pedido de comentário.

Parte do problema é que o resultado de um modelo de IA é altamente dependente da forma específica como é solicitado e da fonte de informação em que se baseia. Se você pesquisar por “biconimania”, a visão geral da IA do Google poderá tratá-la como uma condição legítima; se você perguntar "A bixonimania realmente existe?" o mesmo recurso pode confirmar que não é legítimo e é apenas um substantivo inventado.

O “sucesso” do experimento bixonimania também está relacionado ao alto grau de autenticidade em seu formato de embalagem: utiliza o formato profissional de trabalhos acadêmicos e documentos clínicos, e parece uma “fonte oficial”. Mahmud Omar, médico da Escola de Medicina de Harvard que está envolvido em pesquisas de IA médica, descobriu em um estudo que abrange 20 modelos grandes que, quando o texto de entrada é apresentado em estilos médicos profissionais, como resumos de alta e artigos clínicos, os modelos grandes têm maior probabilidade de "adicionar combustível e vinagre" à informação original e criar alucinações; se o texto vier das redes sociais e tiver um tom mais casual, a probabilidade de alucinações é menor. Ele ressaltou que a atual velocidade do modelo iterativo das empresas de IA é extremamente rápida, e a indústria ainda não formou um processo unificado e um consenso para testes automatizados e rigorosos de cada versão, o que torna a avaliação de segurança e o controle padronizado muito mais difíceis.

O que é ainda mais alarmante é que esta experiência finalmente rompeu a fronteira entre máquinas e humanos e entrou num jornal médico oficial. A pesquisa sobre a bixonimania foi citada em vários artigos, incluindo um na revista médica Cureus, do Instituto Maharishi Markandeshwar de Ciências Médicas e Pesquisa em Moulana, Índia. O artigo citava uma das pré-impressões forjadas e escrevia: “Bixonimania é uma forma emergente de pigmentação periorbital (POM) associada à exposição à luz azul, e seu mecanismo requer estudos mais aprofundados”. Depois que a equipe de notícias da "Nature" buscou a confirmação da revista, "Cureus" anunciou sua retirada em 30 de março de 2026, alegando que havia três referências irrelevantes no artigo, incluindo uma que apontava para uma doença fictícia, e o departamento editorial, portanto, "não pode mais manter a confiança na precisão e na fonte deste trabalho". Os autores discordaram da decisão de retratação, mas o artigo acabou sendo oficialmente retratado.

Ruani acredita que este incidente foi muito além do âmbito da "IA falando bobagem" porque também "enganou os humanos" e expôs que o mecanismo de confiança dos pesquisadores científicos na fonte e no conteúdo dos documentos está sendo corroído. “Precisamos proteger nossa confiança como ouro”, disse ela. “A situação atual pode ser descrita em uma palavra: caos.”

Ao projetar este experimento, Osmanovich Thunström também teve preocupações. Ela estava preocupada que “semear” deliberadamente uma doença falsa na literatura científica pudesse causar danos reais. Para este fim, ela consultou um consultor de ética sobre os riscos potenciais e escolheu deliberadamente problemas de pele menores de relativamente “baixo risco” como temas para reduzir possíveis impactos negativos. “O que quero ter a certeza é que, ao fazer experiências desta forma, estamos a reduzir os danos em vez de criar mais danos”, disse ela.

A reacção em cadeia em torno da bixonimania demonstra claramente como a desinformação pode facilmente penetrar múltiplas camadas de defesas técnicas e institucionais numa era em que a inteligência artificial generativa está a desenvolver-se rapidamente e a produção académica é altamente dependente de ferramentas digitais. Desde chatbots a revistas revistas por pares, a participação conjunta de máquinas e humanos neste “engano colectivo” também forçou a academia, a indústria e os reguladores a repensar: como recalibrar o significado de “credibilidade” na nova fase da participação da IA na produção de conhecimento, e como traçar uma fronteira prudencial mais clara e mais estável, ao mesmo tempo que se procura a eficiência.