Google reduz fornecimento de energia de computação Gemini para Meta

De acordo com o Financial Times, citando pessoas familiarizadas com o assunto, o Google alertou a Meta por volta de março deste ano que ela não poderia mais atender às suas necessidades de capacidade e poder de computação em grande escala para o modelo Gemini, forçando o gigante social a reduzir seu uso e adiar vários projetos internos de IA. Restrições relevantes ainda estão em vigor. A Meta pediu aos funcionários internos que “observassem de perto” o consumo de tokens de IA e usassem uma abordagem mais restrita para chamar entradas, saídas e uso geral do modelo. Isto contrasta fortemente com a atitude da empresa de promover vigorosamente internamente e até de “obrigar” o uso de IA em determinados cenários durante o ano passado.

O relatório apontou que, embora a Meta tenha investido pesadamente na construção de seu próprio modelo de código aberto Llama nos últimos anos, e o CEO Mark Zuckerberg tenha declarado continuamente que a IA se tornará a plataforma central da próxima geração da empresa, a Meta na verdade depende fortemente do Gemini do Google em muitos links de negócios importantes. De acordo com pessoas familiarizadas com o assunto, o Meta utiliza o Gemini extensivamente em cenários como atendimento ao cliente, chatbots de anunciantes, geração de código, remoção de conteúdo suspeito ou prejudicial e detecção de fraudes, e foi selecionado como a solução interna preferida justamente porque seu desempenho é melhor que o próprio modelo do Meta; ao mesmo tempo, Claude da Anthropic também está competindo e utilizando-o em alguns negócios.

O aperto na oferta do Google não afeta apenas o Meta, mas também outros clientes que usam Google Cloud e Gemini, mas o Meta se destaca porque a demanda é muito maior do que clientes semelhantes. Ao contrário do Google, da Microsoft e da Amazon, a Meta não opera o seu próprio negócio de computação em nuvem, o que significa que, além dos seus sistemas internos de IA autodesenvolvidos, deve adquirir poder de computação externo e serviços de modelo dos concorrentes. No contexto da rápida expansão da procura interna, este problema de dependência estrutural é ainda mais amplificado.

Para fazer face à crescente procura por IA, a Google continuou a aumentar o investimento em centros de dados e hardware dedicado nos últimos anos. A receita trimestral de seus negócios em nuvem ultrapassou 20 bilhões de dólares americanos e sua carteira de pedidos inacabados está próxima de 460 bilhões de dólares americanos, mostrando que a demanda geral do mercado de energia computacional excede em muito a capacidade de produção existente. O Google disse que seu modelo primário processou mais de 16 bilhões de tokens por minuto por meio de chamadas diretas de API, um aumento de cerca de 60% em relação ao trimestre anterior. Isto também confirmou que, na fase de comercialização de grandes modelos, o poder e a capacidade computacional estão a tornar-se recursos-chave de estrangulamento.

A Meta está tentando resolver o mesmo problema por outro caminho: por um lado, a empresa está expandindo seu próprio data center e, por outro lado, está trabalhando com a Broadcom para desenvolver chips de aceleração MTIA personalizados, na esperança de reduzir gradualmente sua dependência de serviços em nuvem e provedores de modelos como o Google no futuro. Após o revés na aposta no Metaverso, a Meta precisa urgentemente estabelecer uma narrativa de “próxima plataforma” no campo da IA. Este incidente de ser "limitado" devido à dependência excessiva de modelos externos também expôs as suas deficiências e urgência na infraestrutura e no layout do poder computacional.