Meta, OpenAI e Microsoft disseram em uma conferência da AMD que usarão o mais recente chip de IA da AMD, InstinctMI300X. É o maior sinal de que as empresas de tecnologia estão procurando alternativas aos caros processadores gráficos Nvidia, que são essenciais para a criação e implantação de programas de inteligência artificial como o ChatGPT da OpenAI.
Se os mais recentes chips de última geração da AMD forem suficientes para atender às necessidades das empresas de tecnologia e provedores de serviços em nuvem que constroem e mantêm modelos de IA quando começarem a ser comercializados no início do próximo ano, isso poderá reduzir o custo de desenvolvimento de modelos de IA e colocar pressão competitiva sobre o crescente crescimento das vendas de chips de IA da Nvidia.
“Todo o interesse está focado em grandes processadores e grandes GPUs para computação em nuvem”, disse Lisa Su, CEO da AMD, na quarta-feira.
A AMD afirma que o MI300X é baseado em uma nova arquitetura que normalmente resulta em melhorias significativas de desempenho. Sua característica mais notável são os 192 GB de memória HBM3 de última geração e alto desempenho, que transfere dados com mais rapidez e pode acomodar modelos maiores de inteligência artificial.
Durante um evento de analistas na quarta-feira, a CEO Lisa Su comparou diretamente o InstinctMI300X e o sistema que ele constrói com a principal GPU AI da Nvidia, a H100.
“Esse desempenho se traduz diretamente em uma melhor experiência do usuário”, disse Su. “Quando você faz uma solicitação ao modelo, você deseja que ele responda mais rapidamente, especialmente à medida que a resposta se torna mais complexa”.
A principal questão que a AMD enfrenta é se a empresa, que sempre foi baseada na Nvidia, investirá tempo e dinheiro para adicionar outro fornecedor de GPU. “Adotar a AMD ainda requer esforço”, disse Su Zifeng.
A AMD disse a investidores e parceiros que melhorou seu conjunto de software, chamado ROCm, para competir com o software CUDA padrão da indústria da Nvidia, abordando uma falha importante que tem sido uma das principais razões pelas quais os desenvolvedores de IA preferem atualmente a Nvidia.
O preço também é importante – a AMD não divulgou o preço do MI300X na quarta-feira, mas os chips da Nvidia custam cerca de US$ 40 mil. Su Zifeng disse aos repórteres que, para convencer os clientes a comprar, os chips da AMD devem ter custos de compra e operacionais mais baixos do que os da Nvidia.
A AMD disse que assinou acordos para usar o chip com algumas das empresas que mais precisam de GPUs. Meta e Microsoft são os dois principais compradores de GPUs Nvidia H100 em 2023, de acordo com um relatório recente da empresa de pesquisa Omidia.
Meta disse que usará a GPU InstinctMI300X para lidar com cargas de trabalho de inferência de IA, como processamento de adesivos de IA, edição de imagens e assistentes de operação. O diretor de tecnologia da Microsoft, Kevin Scott, disse que a Microsoft usará o chip MI300X por meio dos serviços de rede do Azure. A computação em nuvem da Oracle também usará esse chip.
A OpenAI disse que oferecerá suporte às GPUs da AMD em um produto de software chamado Triton. Triton não é um modelo de linguagem grande como o GPT, mas é usado em pesquisas de inteligência artificial.
A AMD ainda não previu vendas em grande escala do chip, apenas projetando receita total de GPU de data center de cerca de US$ 2 bilhões em 2024. As vendas de data center da Nvidia chegaram a US$ 14 bilhões apenas no trimestre mais recente, embora esse número inclua outros chips além de GPUs.
No entanto, a AMD disse que o mercado total de GPUs de IA pode subir para US$ 400 bilhões nos próximos quatro anos, o dobro da previsão anterior da empresa, um sinal de quão altas são as expectativas para chips de IA de ponta e porque a empresa está agora concentrando a atenção dos investidores em sua linha de produtos. Su Zifeng também disse aos repórteres que a AMD não acredita que precise vencer a Nvidia para alcançar bons resultados no mercado.
Ao falar sobre o mercado de chips de inteligência artificial, ela disse aos repórteres: “Acho que está claro que a Nvidia precisa ocupar a grande maioria agora”. “Achamos que até 2027 esse número poderá ultrapassar US$ 400 bilhões. Podemos ficar com boa parte disso.”