A Academia Chinesa de Tecnologia da Informação e Comunicação anunciou hoje que lançou oficialmente o teste de adaptação de localização do DeepSeek V4 para promover uma colaboração profunda entre o modelo e o software e hardware doméstico e acelerar a implementação industrial.Este teste foi realizado com base no Laboratório Chave do Ministério da Indústria e Tecnologia da Informação e no sistema de benchmark AISHPerf, cobrindo produtos de software e hardware de IA full-stack, como chips, servidores, máquinas multifuncionais, clusters, cadeias de ferramentas de desenvolvimento e plataformas de computação inteligentes, com foco nos processos de inferência e ajuste fino da série completa de modelos DeepSeek V4.

A avaliação avalia cinco dimensões: facilidade de adaptação, integridade funcional, efeito de otimização, desempenho e custo, e recentemente adiciona indicadores especiais, como processamento de sequência, capacidades de código, taxa de sucesso de chamadas de agentes e desmontagem de tarefas para formar um sistema de avaliação tridimensional.

No dia de seu lançamento, o DeepSeek V4 alcançou a adaptação do Dia 0 para vários hardwares domésticos, marcando a entrada de software e hardware de IA domésticos no estágio de iteração de mesma frequência.

Este teste verificará objetivamente o nível de adaptação, fortalecerá o apoio ao poder de computação nacional e acelerará a construção de um ecossistema de IA independente e controlável.

DeepSeek V4 inclui duas versões: V4-Pro (Flagship Edition) e V4-Flash (Lightweight Edition). Ambas as versões suportam nativamente 1 milhão de contextos ultralongos de Token (aproximadamente 750.000 palavras). Eles adotam um mecanismo de atenção escassa DSA autodesenvolvido para reduzir o custo de inferência para um milhão de contextos em 70% e reduzir o uso de memória em 40%.

V4-Pro: Os parâmetros totais chegam a 1,6 trilhão e os parâmetros de ativação são 49B. Ele se concentra no limite máximo de desempenho, em benchmarks com os principais modelos de código fechado do mundo, como GPT-5 e Claude Opus, e é adequado para raciocínio complexo, geração de código, cálculos de pesquisa científica e outras tarefas difíceis.

V4-Flash: Parâmetros totais 284B, parâmetros de ativação 13B, com foco em alta eficiência e baixo custo, capacidade de raciocínio próxima à versão Pro, velocidade mais rápida, preço mais baixo, adequado para interação diária, criação de conteúdo, implantação empresarial leve e outros cenários.