O ChatGPT-5 foi lançado, portanto, uma atualização importante da versão do grande modelo doméstico DeepSeek não está longe.A julgar pelas perguntas feitas pelos internautas ao DeepSeek, a resposta dada pelo modelo é que o DeepSeek-R2 deverá ser lançado entre 15 e 30 de agosto de 2025.

Neste contexto, os preços das ações de muitas empresas da cadeia de poder da computação nacional dispararam. Por exemplo, a Cambrian atingiu hoje um limite diário de 20 cm, com o preço das suas ações atingindo um máximo histórico e o seu valor de mercado ultrapassando os 355 mil milhões de yuan.

De acordo com declarações anteriores, o grande modelo DeepSeek-R2 usará um modelo especialista híbrido (MoE) mais avançado, que é combinado com uma camada de rede de gating mais inteligente (Gating Network) para otimizar o desempenho de tarefas de inferência de alta carga.

Alguns analistas prevêem que o preço do DeepSeek-R2 pode ser significativamente inferior ao de produtos similares da OpenAI, indicando que pode subverter o modelo de preços dos serviços de IA existentes.

Além disso, notícias relevantes mostram que o DeepSeek-R2 deverá custar 97% menos que o GPT-4; e é treinado no cartão Ascend, com foco no controle abrangente e independente de toda a cadeia do setor.

Segundo fontes relevantes, o número total de parâmetros do DeepSeek-R2 pode chegar a 1,2 trilhão, o que é aproximadamente o dobro dos 671 bilhões de parâmetros do DeepSeek-R1.

DeepSeek-R2 é um modelo treinado com base no cluster de chips Ascend 910B da Huawei. Ele tem um poder de computação de 512 PetaFLOPS com precisão FP16 e uma eficiência de uso de chip de 82%.

De acordo com estatísticas do Huawei Labs, esse desempenho equivale a cerca de 91% do cluster de treinamento A100 da geração anterior da NVIDIA. Ainda não se sabe se são reais ou não, mas parece ser mais poderoso e autônomo.