Recentemente, Mark Zuckerberg, da Meta Company, postou um artigo no Instagram afirmando que planeja comprar 350.000 chips GPU H100 do designer de chips Nvidia antes do final deste ano. A memória da Internet é: Em 2023, a Meta Company planeja desenvolver seu próprio chip v1 para inteligência artificial.
O relatório financeiro do terceiro trimestre da Meta mostrou que as despesas totais no ano fiscal de 2024 ficarão entre 94 mil milhões e 99 mil milhões de dólares, em parte devido à expansão do poder computacional.
Em 2023, a Meta divulgou pela primeira vez o progresso de seus chips autodesenvolvidos, afirmando que começou a planejar o desenvolvimento de um chip interno para treinamento de modelos de inteligência artificial. Eles chamaram esse novo chip de Meta Training and Inference Accelerator, ou MTIA (MTIAv1), para abreviar, e o classificaram como uma "família de chips" que acelera o treinamento de inteligência artificial e cargas de trabalho de inferência, e planeja lançá-lo em 2025. Este chip personalizado usa a arquitetura de chip de código aberto RISC-V, que é do tipo ASIC.
Desde a popularidade do grande modelo OpenAI em 2023, a demanda dos gigantes da Internet por chips de IA explodiu da noite para o dia e foi difícil encontrar um cartão por um tempo. Para evitar ser controlado por terceiros e economizar custos, grandes gigantes anunciaram o desenvolvimento de chips de IA autodesenvolvidos.
A Amazon parece ter assumido a liderança e já possui dois chips específicos para IA – o chip de treinamento Trainium e o chip de inferência Inferentia; O Google possui a unidade de processamento tensor (TPU) de quarta geração. Em contraste, Microsoft, Meta e outros ainda dependem fortemente de hardware pronto para uso ou personalizado de fabricantes de chips como Nvidia, AMD e Intel.
Segundo relatos, a Microsoft vem desenvolvendo secretamente seu próprio chip de IA, de codinome Athena. O chip é fabricado pela TSMC e usa um processo avançado de 5 nm. O lançamento está planejado para 2024. O v1 do MTIA também tem um desempenho literal muito forte. Ele usa a tecnologia de processo de 7 nm da TSMC, funciona a 800 MHz, tem um TDP de apenas 25 W, uma capacidade de computação inteira INT8 de 102,4TOPS e uma capacidade de computação de ponto flutuante FP16 de 51,2TFLOPS.
De acordo com os cálculos da OpenAI, desde 2012, a quantidade de computação utilizada na formação global em IA cresceu exponencialmente, duplicando em média a cada 3,43 meses. Em 2023, a corrida por chips de IA por parte de grandes gigantes fez com que o preço do Nvidia H100 continuasse a aumentar e ficasse fora de estoque.
Por que a Meta gastou enormes somas de dinheiro para comprar chips Nvidia, independentemente do custo? Zuckerberg também disse no post de quinta-feira que vinculará os investimentos em inteligência artificial à sua visão de um metaverso baseado em AR/VR e planeja lançar a próxima versão do modelo de linguagem em grande escala Llama.
Para os gigantes globais da Internet e empresas de tecnologia, a competição em 2024 já começou. Começará uma nova rodada de competição pelo poder da computação?