Nova pesquisa: chatbots de inteligência artificial são mais criativos do que a média dos humanos

Um estudo recente publicado na revista Scientific Reports sugere que os chatbots de inteligência artificial de modelo de linguagem grande (LLM) podem superar os humanos comuns em tarefas criativas, como o brainstorming de usos alternativos para itens comuns – um reflexo do pensamento divergente. No entanto, os indivíduos com maior pontuação nestas tarefas ainda superaram os resultados dos chatbots com melhor desempenho.

O pensamento divergente é um processo de pensamento frequentemente associado à criatividade que enfatiza a geração de muitas ideias ou soluções diferentes para uma tarefa específica.

Normalmente é avaliado por meio da Tarefa de Uso Alternativo (AUT), na qual os participantes são solicitados a encontrar o maior número possível de usos alternativos para objetos do cotidiano em um curto período de tempo. As respostas foram divididas em quatro categorias diferentes: fluência, flexibilidade, originalidade e elaboração.

Mika Koivisto e Simone Grassini compararam as respostas de 256 participantes humanos com as de três chatbots de IA (ChatGPT3, ChatGPT4 e Copy.Ai) e suas respostas AUT a quatro objetos: uma corda, uma caixa, um lápis e uma vela. Os autores avaliaram a originalidade das respostas avaliando a distância semântica (quão próxima a resposta se relaciona com o uso original do objeto) e a criatividade.

A distância semântica é quantificada usando métodos computacionais em uma escala de 0 a 2, enquanto avaliadores humanos, cegos para o iniciador da resposta, avaliam subjetivamente a criatividade em uma escala de 1 a 5. Em média, os chatbots geraram respostas que pontuaram significativamente mais altas do que as respostas humanas para distância semântica (0,95 vs. 0,91) e criatividade (2,91 vs. 2,47).

As respostas humanas tiveram uma gama mais ampla em ambas as métricas – as pontuações mais baixas foram muito mais baixas do que as respostas da IA, mas as pontuações mais altas foram geralmente mais altas. A melhor resposta humana superou a melhor resposta de cada chatbot em sete das oito categorias de classificação.

Estas descobertas sugerem que os chatbots de IA podem agora gerar ideias pelo menos tão bem quanto os seres humanos. No entanto, os autores observam que consideraram apenas o desempenho numa única tarefa relevante para a avaliação da criatividade. Os autores sugerem que pesquisas futuras poderiam explorar como integrar a inteligência artificial no processo criativo para melhorar o desempenho humano.