A OpenAI tornou-se cada vez mais optimista em relação às receitas esperadas dos consumidores e das empresas, aumentando significativamente a sua previsão de receitas para os próximos cinco anos. No entanto, a sombra que paira sobre estas previsões é que os custos dos servidores em nuvem continuam a aumentar e a taxa de crescimento excedeu a taxa de crescimento das receitas.

Esta pressão foi particularmente evidente no ano passado: a margem de lucro bruto da OpenAI caiu para 33%, de 40% em 2024, longe da sua própria meta de 46%. A principal rival, a Antrópico, também elevou recentemente sua previsão de receita, mas disse em dezembro que esperava margens brutas de 40% em 2025. Embora esta seja uma grande melhoria em relação à margem bruta de -94% em 2024, ainda está 10 pontos percentuais abaixo da meta anterior da Antrópico.
Para ambas as empresas, um dos principais motivos é o aumento dos custos de inferência – o valor que as empresas pagam aos provedores de nuvem pelo poder de computação quando os usuários interagem com chatbots ou chamam modelos por meio de APIs.
Os custos de inferência da OpenAI quadruplicaram no ano passado para US$ 8,4 bilhões, acima dos US$ 6,6 bilhões previstos no verão passado. A empresa disse aos potenciais investidores que teria que adquirir recursos de servidor a um custo mais elevado devido à procura superior ao esperado pelos seus serviços.
Os provedores de serviços em nuvem cobram pelo aluguel de servidores sob demanda (ou seja, instâncias spot), que geralmente é muito mais alto do que o preço reservado antecipadamente.
Entretanto, espera-se que os custos de inferência da Anthropic mais do que tripliquem, para 2,7 mil milhões de dólares em 2025, também mais elevados do que a empresa esperava anteriormente, por razões que não são claras.
Vale destacar que apesar do aumento no número de usuários do serviço, as margens de lucro bruto das duas empresas pioraram. O preço médio do aluguel de energia computacional ao longo do ano está, na verdade, diminuindo, e as duas empresas afirmam ter encontrado maneiras de operar modelos grandes com mais eficiência.
Uma razão para o declínio das margens brutas da OpenAI pode ser o custo de execução do ChatGPT para um grande número de usuários gratuitos. Conforme relatei, apenas cerca de 5% dos 910 milhões de usuários semanais da OpenAI são clientes pagantes. As projeções financeiras da empresa mostram que quase metade dos seus custos totais de inferência no ano passado, 3,9 mil milhões de dólares, foram gastos no apoio a utilizadores gratuitos, em comparação com 4,5 mil milhões de dólares para utilizadores pagos.
Outro fator é o tipo de IA que essas empresas utilizam. No ano passado, a OpenAI lançou o modelo de geração de vídeo Sora, que requer muito mais poder computacional do que consultas de texto simples. O modelo de inferência também lançado ao mesmo tempo também requer mais poder de computação para gerar respostas do que os modelos tradicionais de grandes linguagens.
De acordo com pessoas familiarizadas com o assunto, a empresa também está permitindo que os usuários experimentem uma série de novos recursos computacionalmente intensivos antes de introduzir limites de uso, incluindo o modelo GPT‑4o, que é popular para gerar imagens no estilo Ghibli.
No entanto, existem pontos positivos.
A eficiência do serviço da OpenAI para utilizadores pagantes melhorou significativamente: a sua margem de lucro bruto de poder de computação (a receita restante após a execução de modelos para esses utilizadores) atingiu cerca de 70% em outubro, o que é superior a cerca de 52% no final de 2024 e cerca de 35% em janeiro de 2024.
A OpenAI planeja gerar mais receita de usuários gratuitos, principalmente na forma de publicidade e comércio eletrônico, e fazer com que mais usuários gratuitos se convertam em assinantes. Por exemplo, em janeiro, a empresa lançou um pacote de assinatura ChatGPT suportado por anúncios, com preço global de aproximadamente US$ 5 a US$ 8 por mês.
Este ano, a OpenAI espera gastar cerca de 66% do seu total de US$ 14,1 bilhões em custos de inferência atendendo clientes pagantes. Até ao final de 2030, espera-se que 94% dos aproximadamente 85 mil milhões de dólares em custos de inferência sejam utilizados para apoiar utilizadores pagantes. Nesse mesmo ano, a expectativa é que sua margem bruta suba para 67%.
Ainda assim, o recente desempenho financeiro da OpenAI e da Anthropic levanta questões sobre se conseguirão atingir o seu objectivo de margens brutas acima de 60% até ao final de 2030 – um nível que estaria ao nível de algumas das principais empresas de software de capital aberto da actualidade.
Atualmente, a OpenAI e a Anthropic parecem não ter pressão para fazer com que os investidores assumam esses custos. Mas, em última análise, devem provar que as receitas comerciais geradas pelos utilizadores são suficientes para cobrir o custo da prestação de serviços aos mesmos.