Na tarde de 29 de maio, muitos internautas descobriram que o DeepSeek tem um limite no número de vezes que pode ser regenerado e modificado. Depois de modificar ou regenerar várias vezes consecutivas, a página avisará que o limite superior foi atingido. Alguns internautas relataram que em conversas normais, o limite superior será alcançado após regeneração de 3 a 6 vezes; enquanto estiver no modo especialista, pode haver apenas 3 oportunidades. O limite superior dos tempos de entrada de modificação é geralmente 6 vezes.


No momento, o DeepSeek não fez um anúncio oficial, nem tornou pública uma tabela de cotas fixas, mas esse assunto gerou discussões acaloradas na comunidade - afinal, o DeepSeek tem um grande número de usuários fiéis, inclusive eu. Ocasionalmente, encontramos servidores ocupados e travamentos de páginas, o que é compreensível para todos, mas não podemos simplesmente adicionar restrições silenciosamente, o que deixa as pessoas em pânico.

A API não é afetada de forma alguma, então provavelmente é um problema de infraestrutura, uma receita familiar.


01

Limite de corrente temporário sob falta de energia computacional?

Em relação a esta restrição, a “conta semioficial” Baiqiang em Xiaohongshu disse: Não entre em pânico, isso é temporário.


Segundo ele, “modificar mensagem” e “regenerar” foram subitamente restringidos. Não que o DeepSeek estivesse fazendo a chamada "otimização negativa", era apenas issoMedidas temporárias tomadas após a pressão do poder de computação ser muito grande.

Como o número de usuários do DeepSeek cresceu rapidamente durante esse período, especialmente a partir da tarde de 29 de maio, a pressão de solicitação por parte do aplicativo era óbvia. Para priorizar e garantir que as conversas de texto mais básicas ainda possam ser usadas normalmente, a equipe só pode primeiro restringir operações de alta frequência, como “modificar mensagens” e “regenerar”.

Embora na interface do usuário, "regenerar" seja apenas um clique de um botão, e "modificar mensagem" seja apenas uma questão de alterar a pergunta original. Mas para o servidor, essas duas coisas não são simples atualizações, mas uma nova solicitação de inferência. Cada vez que o usuário clica para regenerar, o modelo deve reprocessar o contexto e gerar a resposta. O mesmo se aplica à modificação da mensagem. Contanto que a pergunta original mude, o modelo precisa respondê-la novamente com base na nova entrada.

Portanto, quando um grande número de usuários clica repetidamente ao mesmo tempo e trata “Regenerar” como um botão infinito de desenho de cartas, essas solicitações se tornarão uma forte pressão sobre o servidor.

Este assunto pode ser visualizado juntamente com algumas mudanças recentes no DeepSeek. Por exemplo, a razão por trás do upload e exclusão de arquivos no modo especialista, da desativação da função de pesquisa inteligente e do "servidor ocupado" de vez em quando é, na verdade, a escassez de recursos de computação.A pressão geral do serviço tornou-se tão alta que é necessário fazer concessões.


DeepSeek é tão fácil de usar que a infraestrutura subjacente precisa acompanhar.

Em relação à situação em que “modificar mensagem” ou “regenerar” atinge o limite superior, o conselho de Baiqiang é não clicar contínua e rapidamente. Você pode parar primeiro e esperar de 15 a 30 minutos antes de tentar novamente. Segundo o relato, na maioria dos casos a restrição será restaurada automaticamente após espera; se você clicar repetidamente e rapidamente, o sistema poderá reconhecer como uma solicitação de frequência anormalmente alta, fazendo com que o tempo de restrição se torne mais longo.

Bai Qiang também mencionou que os novos cartões de super nó Ascend da Huawei estão sendo implantados e devem estar online no segundo semestre do ano. Até lá, o poder computacional será significativamente expandido e estas restrições temporárias provavelmente serão levantadas.

No entanto, DeepSeek ainda não emitiu oficialmente um anúncio sobre este assunto. Incluindo o número de limites, tempo de recuperação e mudanças específicas após a expansão do poder computacional no segundo semestre do ano, ainda precisamos aguardar novas confirmações oficiais.

02

DeepSeek não é um caso isolado

Na verdade, a DeepSeek não é a primeira empresa de IA a fazer isso.

Quando o poder de computação de produtos de modelos grandes é reduzido, os usuários aumentam ou a pressão é muito alta durante os períodos de pico, as práticas comuns são limitar o fluxo atual, fazer downgrade, enfileirar-se ou limitar separadamente algumas funções de alto consumo.

O ChatGPT sempre teve um limite de mensagens, e mesmo usuários pagos podem encontrar limites de uso durante períodos de alta demanda. Depois que os usuários gratuitos atingirem a cota do modelo avançado, eles também serão migrados para um modelo mais leve para continuar a usá-lo.

Pode ser entendido como uma espécie de “downgrade de serviço”, o que não significa que seu uso não seja permitido, mas que todos não podem ter uso ilimitado dos recursos mais caros e que consomem muitos recursos.


Semelhante ao Claude, a Anthropic definirá orçamentos de uso para diferentes usuários, e cenários de alta frequência, como Claude Code e API, também ajustarão o limite superior de acordo com as mudanças de capacidade. Quando o poder computacional é abundante, a cota pode ser aumentada; quando a pressão da procura aumentar, as restrições tornar-se-ão mais óbvias.

Em 6 de maio, a Anthropic também emitiu um documento especial dizendo que com a nova cooperação em poder de computação e aumento de capacidade, aumentou o limite de uso do Claude Code e da Claude API. Por sua vez, também mostra queO limite de utilização está diretamente ligado à capacidade de potência computacional. Ele será reforçado quando o poder de computação for reduzido e será relaxado depois que o poder de computação for expandido.


No entanto, a Anthropic agora definiu limites de uso mais detalhados para diferentes cotas de assinatura, e cenários de alto consumo, como o Claude Code, estão se aproximando da lógica de medição e cobrança de tokens.

Os produtos de geração de imagens e vídeos são mais típicos. As funções de geração de imagens de Sora e Gemini, bem como outras ferramentas de vídeo de IA, passaram por tempos de redução do número de gerações, tempos de fila mais longos e cotas gratuitas reduzidas quando a demanda aumentou.

Pode-se dizer que “toda inferência tem um custo” tornou-se uma realidade inevitável para os produtos de IA.

Há algum tempo, a cobrança dos pufes desencadeou uma roda de discussão. “Doubao, caro e difícil de usar” já se tornou uma pesquisa popular no Weibo. Desta vez, é diferente das funções restritas do DeepSeek, mas a lógica por trás das reações dos usuários é a mesma: todos estão acostumados com o fato de os produtos de IA serem baratos e fáceis de usar. Assim que a plataforma começar a cobrar ou a restringir certas funções, o sentimento do usuário se recuperará facilmente.

Na verdade, é uma prática muito comum que as empresas de IA liberem recursos básicos, comecem a cobrar por recursos complexos, estabeleçam cotas para funções de alto custo e limitem temporariamente o fluxo durante períodos de pico.

DeepSeek limita o número de “mensagens de regeneração” e “modificação”, o que não é incomum em toda a indústria de IA. O que ele restringe não é a entrada do chat ou o modelo em si, mas apenas aquelas operações que são fáceis de serem clicadas com frequência pelos usuários, mas cada clique consumirá novamente recursos de raciocínio.

Como o diálogo básico deve ser preservado tanto quanto possível, este é o resultado final para que os usuários possam usar o produto; no entanto, funções como regeneração, modificações repetidas, uploads de arquivos, pesquisas na Internet, contexto longo e geração multimodal têm maior probabilidade de serem limitadas ou rebaixadas quando a pressão é alta.

Sinto que o foco desta controvérsia não é “quanto limitar”, mas “como limitar”.

Se o funcionário pudesse explicar anteriormente que este é um limite atual temporário, quanto tempo levará para ser retomado e quais operações são afetadas, os usuários provavelmente aceitariam isso mais.Mas se de repente ficar indisponível sem um anúncio, é claro que todos se perguntarão imediatamente se as funções estão diminuindo e se haverá cobranças no futuro.

Quando os produtos de IA passarem de ferramentas de adoção inicial para ferramentas diárias, os usuários se preocuparão cada vez mais com a estabilidade e a transparência. As limitações em si são compreensíveis, mas é melhor não permitir que os usuários saibam delas pela primeira vez em uma janela pop-up.

O DeepSeek precisa saber que se o número de utilizações aumentar tanto que precise ser limitado, isso também significa que há muitos usuários esperando por você.

Mesmo que seja apenas uma carta de aprovação.