Nos últimos dias, a indústria de IA ainda incentivava as empresas a "gastar seus orçamentos", mas agora está rapidamente se transformando em um modelo de "estrangulamento", porque as empresas descobriram que mesmo que usem IA apenas para lidar com algumas pequenas tarefas, elas podem facilmente queimar uma grande quantidade de taxas simbólicas, mas podem não obter o mesmo retorno. Cada vez mais empresas estão começando a restringir o uso de ferramentas de IA pelos funcionários, e as empresas estão entrando em um estágio chamado “racionamento de tokens”, que é o racionamento de recursos de IA.

A empresa de consultoria Accenture tentou recentemente impedir que os funcionários usassem IA para realizar tarefas básicas, como converter PDFs em apresentações, para evitar o uso de muitos tokens. Esse aperto ocorreu não muito tempo atrás, quando a Accenture alertou os funcionários que o não uso da IA ​​poderia prejudicar as oportunidades de promoção. Em uma gravação de reunião interna vazada citada pela 404 Media, Justice Kwak, chefe de estratégia de IA de agência da Accenture, disse que a empresa atingiu um ponto crítico em que a IA está começando a impactar significativamente a estrutura de custos e a administração ainda está se perguntando se o investimento realmente vale o dinheiro.

Os custos dos tokens começaram a abalar o modelo de negócios da IA. Nos últimos meses, os preços das ações e as avaliações das empresas relacionadas com a IA têm estado sob pressão, com algumas empresas que dependem fortemente da IA ​​a suportar o peso, especialmente os fabricantes de chips de memória. A indústria está começando a perceber que a IA não pode ser apoiada por “frescura” e “entusiasmo conceitual”. Em última análise, deve provar que pode realmente trazer valor financeiro.

De forma mais ampla, as empresas estão a ajustar coletivamente as suas estratégias internas de IA. Muitas empresas começaram a definir limites de uso semanais ou mensais para os funcionários ou a alocar diferentes orçamentos de tokens para diferentes cargos; algumas empresas também enviarão lembretes quando o uso estiver próximo do limite, permitindo que os funcionários solicitem cotas adicionais. Por trás dessa abordagem está o fato de que provedores de serviços como OpenAI, Anthropic e GitHub ajustaram recentemente seus métodos de precificação, mudando de um modelo que era originalmente mais parecido com um modelo de “uso ilimitado mensal” para um que enfatiza o faturamento com base no consumo real de tokens.

O relatório também apontou que muitas tarefas aparentemente simples não são baratas para implementar em modelos avançados. Por exemplo, transferir análises complexas para um modelo grande em execução por um longo período pode facilmente custar mais de US$ 100; uma análise de vulnerabilidade em larga escala de toda a base de código pode custar até US$ 50.000 a US$ 100.000. É por isso que algumas empresas começaram a transferir tarefas básicas para modelos menos potentes e de menor custo, e até misturar produtos de diferentes fabricantes para controlar despesas.

Do ponto de vista da gestão empresarial, esta mudança significa que a IA está a passar de “incentivar utilizações múltiplas” para “cotas finas”. Para os trabalhadores, o acesso à IA já não é apenas uma questão de eficiência, mas também uma questão de gestão orçamental; para CFOs, COOs e CIOs, a IA deve agora ser medida com tanto rigor quanto outros custos essenciais. Isto também marca que a primeira fase de entusiasmo pela IA empresarial está a diminuir, sendo substituída por uma nova fase que é mais pragmática e se preocupa mais com os inputs e os resultados.