Quick Technology informou em 3 de maio que a série DeepSeek V4 de modelos grandes foi lançada oficialmente em 24 de abril. Já se passaram 15 meses desde a atualização do DeepSeek R1 do ano passado. O desempenho do V4 também gerou discussões no país e no exterior, e os americanos também estão muito preocupados.

Houve muitos testes para avaliar a capacidade do DeepSeek V4. Um relatório de pesquisa anterior organizado por 3 pesquisadores seniores do Conselho de Relações Exteriores mostrou que ele está cerca de 7 meses atrás dos principais grandes modelos americanos.

Agora o Centro de Padrões e Inovação de Inteligência Artificial (CAISI), uma subsidiária do Instituto Nacional de Padrões e Tecnologia (NIST), também veio avaliar o DeepSeek V4. A conclusão deles é que o DeepSeek V4 está cerca de 8 meses atrás dos Estados Unidos, o que é semelhante à lacuna anterior.

Em seus resultados de avaliação de capacidade de IA, DeepSeek V4 marcou 800 pontos, e o mais forte atual é GPT-5.5, com uma pontuação de mais de 1200 pontos, GPT-5.4 e Opus 4.6 também estão acima 1000 pontos.

O desempenho geral do DeepSeek V4 é semelhante ao do GPT-5 há 8 meses, mas os funcionários do DeepSeek consideraram anteriormente que era semelhante ao GPT-5.4 em um relatório de lançamento.

No entanto, o CAISI também admitiu que o DeepSeek V4 é o grande modelo de IA mais poderoso que eles avaliaram na China e é muito forte em nove testes nos cinco campos de rede, engenharia de software, ciências naturais, raciocínio abstrato e matemática.

Mais importante ainda, DeepSeek V4 é mais econômico. Mesmo comparado com o mini modelo grande GPT-5.4 mais econômico dos Estados Unidos, o DeepSeek V4 tem melhores custos de teste em 4 de 7 benchmarks, variando de 41% a 53% mais altos.