Impulsionado por aplicações como o AI Agent, o consumo global de palavras aumentou ainda mais. De acordo com os dados mais recentes do OpenRouter, o número total de chamadas globais de grandes modelos de IA na semana passada (18 a 24 de maio) foi de 28,9 trilhões de tokens, um aumento de 7,4% em relação à semana anterior. O número de ligações aumentou por cinco semanas consecutivas, e a demanda por ligações de grandes modelos continua a ser liberada.

Fonte da imagem: OpenRouter
Entre os grandes modelos de IA da lista, o volume de uso semanal dos grandes modelos de IA da China atingiu 9,22 trilhões de Tokens, um aumento mensal de 19,89%; durante o mesmo período, o volume de uso semanal de grandes modelos americanos de IA foi de 4,93 trilhões de tokens, um aumento mensal de 16,27%.As chamadas semanais da China para grandes modelos ultrapassaram as dos Estados Unidos por quatro semanas consecutivas e ficaram em primeiro lugar no mundo.
Até agora, DeepSeek-V4-Flash liderou a lista global de chamadas de grandes modelos de IA do OpenRouter.
OpenRouter é uma plataforma de agregação e chamada de modelos de IA que fornece um sistema transparente de monitoramento e cobrança em nível de token, com o objetivo de resolver os problemas de fragmentação de interface, gerenciamento complexo de chaves e controle de custos enfrentados pelos desenvolvedores ao chamar vários modelos de IA. Seus usuários são principalmente desenvolvedores estrangeiros, com os desenvolvedores chineses representando apenas cerca de 6%.
no país, o aumento substancial no número de chamadas de Token não é novidade. De acordo com o Departamento Nacional de Estatísticas, em março de 2026,A média diária de chamadas de token somente na China ultrapassou 140 trilhões.; O uso médio diário de pufes dobrou para 120 trilhões em 3 meses.
O CICC estima que em cenários de uso moderado, quando a taxa de penetração do Agente atinge 8%, o consumo total de Token do Agente é equivalente ao do Chatbot; a popularidade do Agente mostra um efeito multiplicador no consumo de Token. Com a melhoria sinérgica da complexidade de tarefas únicas, do tempo de uso e da taxa de penetração, espera-se que o consumo médio diário de tokens aumente em mais de 5 vezes.
À medida que o consumo de elementos de palavras aumenta dia a dia, fábricas e operadores de tokens foram lançados um após o outro.
De acordo com os sites oficiais de cada empresa, a China Mobile lançou um produto de serviço de computação Token para usuários individuais em 21 de abril, suportando modelos de linguagem de grande porte, como DeepSeek e Qwen, e um subpacote pode ser adquirido por apenas 5,99 yuans; A China Telecom lançou oficialmente uma série de pacotes de tokens comerciais de teste em 17 de maio, com um preço de versão básica de 39,9 yuans/mês para pequenos, médios e micro clientes; A filial da China Unicom em Xangai anunciou em 16 de maio que fornecerá serviços de token para clientes OPC de Xangai.
Ao mesmo tempo, a China Telecom emitiu um anúncio de licitação para o projeto de aquisição centralizada de serviços de capacidade de geração de "Fábrica de Tokens". A Tianfeng Securities destacou que os data centers de IA estão evoluindo para “fábricas de tokens”, enfatizando a necessidade de capacidades de processamento de dados em grande escala.
A CITIC Securities declarou,O surgimento de fábricas e operadores de tokens marca a transformação das capacidades de geração de tokens de um serviço auxiliar para um serviço padronizado que pode ser precificado., promoverá a mudança do mercado de aluguel de energia de computação do atual modelo de aluguel fixo mensal baseado no tempo de aluguel do servidor "bare metal" para um modelo cobrado com base no uso real do token.
A agência enfatizou que quando o Token se tornar a unidade de cálculo do poder computacional, os provedores de serviços de locação de poder computacional poderão colher plenamente os dividendos trazidos pela expansão contínua da demanda de Token e pela rápida penetração em todos os cenários de aplicação de IA. A atual alta prosperidade da indústria de leasing de energia computacional deve-se principalmente à incompatibilidade entre oferta e demanda no mercado doméstico de energia computacional, o que torna mais proeminentes as vantagens das principais empresas de leasing com recursos de chips de poder computacional de alta qualidade. Combinando a prosperidade da pista e a tendência atual da indústria gradualmente se esclarecendo e se concentrando no topo, estamos otimistas sobre a elasticidade de crescimento dos principais fabricantes de aluguel de energia de computação sob a nova rodada de tendência de crescimento do uso de tokens.