Na noite de 29 de junho, muitos desenvolvedores relataram ter recebido e-mails informando que o DeepSeek lançaria a versão oficial do V4 e ajustaria o faturamento. O e-mail mencionava que a versão oficial do DeepSeek V4 está programada para ser lançada oficialmente em meados de julho, o que trará mais otimizações de recursos e melhorias de desempenho. Ao mesmo tempo, a DeepSeek ajustará simultaneamente sua estratégia de preços de API e introduzirá um mecanismo de preços de pico e vale “para alocar recursos de forma mais razoável e melhorar a estabilidade do serviço”.

O repórter do China Business News viu na plataforma aberta DeepSeek que o funcionário também enviou um aviso aos usuários na página inicial, dizendo que o serviço API deverá adotar uma estratégia de preços de pico e vale a partir de meados de julho, e "o preço durante os horários de pico será o dobro do preço normal".


Especificamente, os horários de pico são definidos como 9h00-12h00 e 14h00-18h00, horário de Pequim, todos os dias, o que quase cobre o horário de trabalho mais importante de desenvolvedores domésticos e usuários corporativos.

Em termos de preço, o preço de entrada de acerto do cache V4 Pro durante os horários de pico é de 0,05 yuan/milhão de tokens, o preço de entrada de falha de cache é de 6 yuan/milhão de tokens e o preço de saída é de 12 yuan/milhão de tokens. Durante os horários de pico do Flash V4, o preço de entrada do cache hit é de 0,04 yuan/milhão de tokens, o preço de entrada do cache miss é de 2 yuan/milhão de tokens e o preço de saída é de 4 yuan/milhão de tokens.

Anteriormente, em 24 de abril, DeepSeek anunciou que a versão de visualização V4 foi oficialmente lançada e de código aberto simultaneamente. Desde então, houve vários reajustes de preços. Em 22 de maio, DeepSeek anunciou que ajustaria o desconto original de 25% por tempo limitado do modelo DeepSeek-V4 para uma redução permanente de preço. O preço da versão de visualização com desconto é consistente com o preço fora de pico anunciado desta vez.

Isso significa que o preço geral da versão oficial do DeepSeek V4 não aumentou, mas se os usuários optarem por chamar a API do modelo durante os horários de pico, o custo dobrará diretamente.

Depois que a notícia foi divulgada, ela atraiu discussões acaloradas entre muitos desenvolvedores. Alguns desenvolvedores acreditam que essa divisão de tempo não é amigável para usuários domésticos, mas para usuários em fusos horários como Europa e Estados Unidos, a maioria dos tempos de chamada cai em horas de vale, o que até certo ponto é mais como "beneficiar usuários estrangeiros".

Muitos desenvolvedores também expressaram compreensão. Um desenvolvedor que usa a API DeepSeek há muito tempo disse aos repórteres que o preço atual do DeepSeek já está em um nível baixo na indústria. Mesmo que o preço aumente para 2 vezes durante os horários de pico, o custo geral ainda é competitivo. "A verdadeira chave não é o preço, mas a atualização de capacidade da versão oficial do V4."

O que mais usuários estão ansiosos é se a versão oficial do DeepSeek V4 pode melhorar seu desempenho em pós-treinamento, multimodalidade, programação, agente, etc., enquanto o preço máximo e mínimo estiver em vigor.

Do ponto de vista da indústria, os preços máximos e mínimos podem significar que os serviços de IA em nuvem estão amadurecendo. Alguns desenvolvedores mencionaram que o poder da computação não é mais unificado a um preço fixo e que o custo dos tokens estará mais próximo do modelo de preço da eletricidade no futuro. No futuro, outros grandes modelos domésticos provavelmente seguirão os preços flexíveis, e a facturação escalonada do poder computacional por tempo tornar-se-á a norma na indústria, mas isto aumenta os custos de agendamento para pequenos e médios programadores.

Isso também significa que os hábitos de uso dos desenvolvedores serão remodelados no futuro. Os preços máximos e mínimos forçarão os desenvolvedores a fazer cache e agendamento de tarefas. Mais tarefas em lote podem ser agendadas para execução fora dos períodos de pico. Os recursos de orquestração de tarefas se tornarão uma nova competitividade para os desenvolvedores controlarem custos.