LGAIResearch, sim, aquela LG que desenvolve eletrônicos de consumo, lançou EXAONEDeep, uma inteligência artificial de raciocínio de alto desempenho que, apesar de um número relativamente pequeno de parâmetros, demonstrou capacidades extraordinárias em lógica matemática, conceitos científicos e desafios de programação.

As métricas de desempenho do modelo principal 32B são comparáveis ​​a modelos maiores, como GPT-4o e DeepSeekR1. Em comparação, as variantes 7,8B e 2,4B estabelecem novos padrões nas categorias de IA leve e no dispositivo.

O modelo EXAONEDeep32B obteve 94,5 pontos na seção matemática do CSAT2025 e 90,0 pontos no AIME2024, superando outros modelos concorrentes e exigindo apenas 5% dos recursos computacionais de grandes modelos alternativos, como DeepSeek-R1 (671B). 

Em raciocínio científico, obteve nota 66,1 na prova GPQA Diamond, que avalia habilidades de resolução de problemas em nível de doutorado em física, química e biologia. O modelo obteve 83,0 pontos no MMLU, a maior pontuação entre os modelos desenvolvidos na Coreia.

Digno de nota é o desempenho das variantes menores: o modelo 7.8B marcou 94,8 pontos no MATH-500 e 59,6 pontos no AIME2025, enquanto o modelo 2.4B marcou 92,3 pontos no MATH-500 e 47,9 pontos no AIME2024. Esses resultados colocam os modelos menores do EXAONEDeep no topo de suas categorias em todos os principais benchmarks, demonstrando o enorme potencial para implantação do EXAONEDeep em ambientes com recursos limitados.

EXAONEDeep tem até 32 bilhões de parâmetros e funciona bem em implantações de GPU única. Curiosamente, esses modelos podem ser executados em uma variedade de GPUs discretas, GPUs de laptop e alguns sistemas de ponta que não possuem recursos de computação em larga escala.