Recentemente, DeepSeek anunciou que ajustará os preços da API em meados de julho, dobrando o preço das chamadas das 9h às 12h e das 14h às 18h durante a semana. O preço de produção do modelo V4-Pro aumentou de 6 yuans para 12 yuans por milhão de tokens. Ao mesmo tempo, os novos preços de uso da eletricidade industrial e comercial da província de Zhejiang entraram oficialmente em vigor em 1º de julho, com 16h00 às 23h00 designado como o período de pico, e um período de "pico" adicional das 18h00 às 22h00 no verão e inverno, com a relação de preços pico-vale aumentando para 2,05 a 0,2.

Uma empresa de IA dobrou o preço da ligação durante o dia e uma rede elétrica provincial designada após as 16h. como um "período de eletricidade cara". As duas indústrias usaram a mesma lógica para ajustar os preços no mesmo mês – ambas confiaram no preço para afastar o pico de procura. DeepSeek gerencia a distribuição temporal do poder de computação e Zhejiang gerencia a distribuição temporal da eletricidade.

A distribuição temporal do poder de computação é essencialmente a distribuição temporal da eletricidade.

A “conta de luz” da IA ​​está começando a ficar cara

Vamos dar uma olhada nas contas globais primeiro.

De acordo com dados da Gartner, o consumo global de eletricidade dos centros de dados atingirá 565TWh em 2026, um aumento líquido de 118TWh em relação aos 447TWh em 2025. O aumento anual de 118TWh é quase equivalente ao consumo anual de eletricidade dos Países Baixos. Entre eles, o consumo de energia dos servidores otimizados para IA disparou de 95TWh para 175TWh, um aumento de 84%. Até 2027, o consumo de energia dos servidores de IA excederá oficialmente o dos servidores tradicionais.

A avaliação do diretor de pesquisa do Gartner, Linglan Wang, é: “O poder de computação de IA de hoje é limitado pela fonte de alimentação”.

O CEO da Microsoft, Nadella, disse no podcast: "O maior problema que enfrentamos agora não é mais o excedente de recursos computacionais, mas se a energia pode ser instalada rapidamente onde há instalações de dados. Se não pudermos fazer isso, poderemos ter um monte de chips no armazém, mas não conectados".

O consumo de energia de um servidor GPU é 3 a 5 vezes maior que o de um servidor tradicional, e o consumo de energia de uma única GPU da arquitetura NVIDIA Blackwell é de 1kW, o que é 40% a mais que os 700W da geração anterior Hopper. O data center “Stargate” construído pela OpenAI no Texas tem uma demanda máxima de energia de 1,4 GW e implanta mais de 400.000 GPUs. Qual é o conceito de 1,4 GW? O suficiente para uma cidade pequena.

O resultado é que, no final, as empresas de IA gastam milhares de milhões para comprar chips, apenas para descobrirem que a energia pode não ser suficiente.

Os preços de pico e vale do DeepSeek são essencialmente a mesma operação no setor de energia – são mais caros durante o dia e mais baratos à noite, usando os preços para direcionar a demanda para períodos baixos. Na verdade, DeepSeek transferiu as regras da rede elétrica para o mercado de energia computacional.

O preço de saída do modelo V4-Pro é de 6 yuans por milhão de tokens durante os períodos de pico e 12 yuans por milhão de tokens durante os períodos de pico. O preço de entrada dos acessos ao cache aumentou de 0,025 yuans para 0,05 yuans. Em maio deste ano, a DeepSeek reduziu permanentemente o seu preço em 75%, desencadeando uma guerra de preços para modelos grandes. Há um mês ainda cobrávamos “preço mínimo”, mas agora cobramos “sobretaxa de pico”.

Por que isso gira tão rapidamente? O gargalo no lado da oferta de poder de computação é maior do que se esperava. Os dados de monitorização pública da indústria mostram que a procura de poder de computação aumentou várias vezes no ano passado, enquanto a taxa de expansão da oferta tem estado longe de acompanhar, sendo a diferença entre a oferta e a procura de cerca de metade. Tencent Cloud subiu 5% em abril, Alibaba Cloud subiu 5% a 34% em março, Baidu Smart Cloud subiu 5% a 30%, AWS subiu 15% e alguns serviços do Google Cloud subiram até 100% em maio. Aumentar os preços não é uma estratégia competitiva, é porque o lado da oferta realmente não consegue suportá-lo.

Os preços de pico e vale do DeepSeek mostram que seu cluster de GPU, assim como a rede elétrica, sofreu picos de congestionamento.

Zhejiang designou o período após as 16h. como "período de eletricidade cara".Para que serve?

A nova versão dos preços da eletricidade industrial e comercial no tempo de uso na província de Zhejiang, que entrou em vigor em 1º de julho, reduz o preço da eletricidade ao longo do dia em cinco níveis: pico, pico, seção plana, vale e vale profundo. A proporção é de 2,05 a 1,85 a 1 a 0,4 a 0,2. Os picos são 10 vezes mais caros que os vales profundos. Os horários de pico matinais originais foram cancelados e a maioria das horas do dia foram alteradas para taxas fixas. Todos os horários de pico são das 16h às 23h, e um pico adicional é das 18h às 22h no verão e no inverno.

Nos últimos anos, a capacidade instalada fotovoltaica de Zhejiang tem se expandido. A geração de energia fotovoltaica é grande ao meio-dia e a eletricidade é barata ou mesmo excedente. Mas à noite, a produção fotovoltaica cai para zero. Voltar para casa depois do trabalho, ligar o ar condicionado, cozinhar e carregar estão todos lotados e a carga na rede elétrica aumenta drasticamente. Isso é o que a indústria de energia chama de “curva de pato” – há muita eletricidade para usar durante o dia e muito cara para usar à noite.

O ajuste de Zhejiang visa permitir que fábricas e data centers transfiram o trabalho para o meio-dia. O documento menciona que se uma empresa siderúrgica com um consumo anual de electricidade de mil milhões de quilowatts-hora transferir 10% do seu pico de consumo de electricidade para períodos mais baixos, poderá poupar mais de 20 milhões de yuans em facturas de electricidade todos os anos, o que é suficiente para construir um sistema de armazenamento de energia.

O documento também mencionou claramente que indústrias como a logística de armazenamento e os centros de dados com "cargas estáveis ​​e grandes espaços ajustáveis" podem desfrutar plenamente dos dividendos dos baixos preços da electricidade. Ao transferir as tarefas de computação para o meio-dia ou tarde da noite, você pode economizar muito nas contas de luz.

DeepSeek gerencia a distribuição temporal do poder de computação e Zhejiang gerencia a distribuição temporal da eletricidade. A distribuição temporal do poder de computação é essencialmente a distribuição temporal da eletricidade - por trás de cada Token está a eletricidade.

De acordo com dados do Gartner, o consumo de energia de servidores otimizados para IA aumentou 84% em um ano. Quanto maior for a demanda de potência de computação, maior será o consumo de energia. Quanto mais restrito o fornecimento de eletricidade, mais parecida com a eletricidade se torna a estrutura de custos do poder de computação.

O relatório de trabalho governamental de 2026 inclui "computação e colaboração computacional" pela primeira vez, revelando o plano de design de alto nível do país para o poder computacional. O centro de potência computacional e a rede elétrica devem ser planejados em conjunto. O poder de computação seguirá o poder, e o despacho de energia depende do poder de computação. Isto não é uma visão, é forçado pela realidade. O Gartner prevê que o consumo de energia dos data centers excederá 1.200 TWh até 2030 e o fornecimento de energia da rede não será capaz de atender à demanda. Se o poder computacional e a eletricidade não estiverem interligados no nível de planejamento, as coisas serão mais problemáticas mais tarde.

Depois do almoço grátis,Vamos começar a calcular os detalhes

Embora o DeepSeek tenha ajustado o preço da API, o preço durante os períodos de pico é, na verdade, exatamente o mesmo que o preço após a redução permanente de preço em maio. O DeepSeek não “aumentou o preço”, apenas adicionou uma sobretaxa para ligações diurnas.

Mas para a maioria dos desenvolvedores, o dia é horário de trabalho. Das 9h às 12h e das 14h às 18h são os horários nobres para escrever código, ajustar interfaces e executar testes. Dobrar o preço durante este período equivale a aumentar os custos diários da maioria das pessoas.

A Foresight Energy entende que, nessas condições, o custo dos aplicativos interativos em tempo real pode aumentar e as tarefas de computação off-line só podem ser transferidas para a noite. No passado, centenas de milhares de pequenas equipes usavam APIs quase gratuitas para verificação de protótipos e o custo era próximo de zero. Após a precificação de pico e vale, se o modelo de negócios depender de chamadas em tempo real, como atendimento ao cliente, pesquisa e conclusão de código, a estrutura de custos precisará ser recalculada.

O relatório do OpenRouter mostra que a lacuna entre os modelos de código aberto e de código fechado permaneceu estável entre três e seis meses nos últimos 18 meses. A relação custo-benefício do modelo de código aberto está consumindo o mercado de APIs de código fechado. Se a DeepSeek continuar a se envolver em guerras de preços, não será capaz de realizar um negócio em circuito fechado. O aumento de preços não é “chega de dinheiro”, é o acordo depois de “chega de dinheiro”.

O ajuste do preço da eletricidade em Zhejiang e os preços de pico e vale do DeepSeek ocorreram na mesma semana. Um é responsável pela eletricidade e o outro é responsável pelo poder de computação. O poder da computação está se tornando uma nova maneira de usar a eletricidade – e não os aparelhos de ar condicionado, as fábricas ou os veículos elétricos. É o cluster de GPU rugindo tarde da noite, tokens fluindo entre servidores e um quilowatt-hora de eletricidade queimando por trás de cada pedaço de código.

O Gartner diz que o poder de computação da IA ​​é limitado pela fonte de alimentação. Nadella disse que o chip pode não ser conectado. DeepSeek disse que ligar durante o dia terá um custo extra. Zhejiang disse que você precisa pagar a mais pelo uso de eletricidade à noite. Juntas, essas vozes apontam na mesma direção: o poder da computação não é mais uma questão de “você pode ter o quanto quiser”. Tem custos, tem gargalos, tem altos e baixos, exige agendamento, exige planejamento.

O “almoço grátis” da indústria de IA está se transformando em uma conta de luz que exige cálculos cuidadosos.