A empresa britânica de design de chips Arm anunciou recentemente o lançamento de uma nova CPU Arm AGI, entrando no mercado de data center pela primeira vez como seu próprio chip produzido em massa, visando cargas de trabalho de inteligência artificial de "agentes" emergentes. Isto marca uma grande mudança no modelo de negócios desta empresa que há muito se concentra no licenciamento de propriedade intelectual. Por mais de três décadas, a Arm forneceu apenas arquitetura e design central, fabricados por parceiros. Agora ela participa diretamente da competição de linha de frente de processadores de data center de alto desempenho com sua série de CPU AGI.

Segundo relatos, a CPU Arm AGI é construída com base na tecnologia de processo de 3 nm. Um único chip integra até 136 núcleos Neoverse V3. O consumo de energia do projeto térmico de toda a placa é de 300 W. Cada núcleo pode obter largura de banda de memória de 6 GB/s e controlar o atraso de acesso em 100 ns. Ele pode suportar um único chip com capacidade máxima de memória de 6 TB e é compatível com especificações DDR5-8800. Em termos de E/S, o processador fornece 96 pistas PCIe Gen 6 e integra interconexões CXL 3.0 e AMBA CHI (Coherent Hub Interface) para suportar requisitos de computação colaborativa de alta largura de banda e baixa latência. Cada núcleo pode lidar de forma independente com um thread de programa. Arm disse que esse design ajuda a evitar que os threads fiquem lotados ou ociosos por um longo tempo em cenários sustentados de alta carga e melhora a utilização geral dos recursos.

Em termos de densidade de potência computacional, que é uma grande preocupação para os data centers, os números divulgados pela Arm mostram que, sob um sistema de refrigeração a ar, um único rack pode implantar até 8.160 núcleos, enquanto o uso de soluções de refrigeração líquida pode aumentar esse número para mais de 45.000. Arm prevê que, para atender às necessidades futuras de desenvolvimento de IA, a potência de computação da CPU necessária por gigawatt de potência nos data centers será mais de quatro vezes maior do que o nível atual. Ela acredita que a arquitetura x86 tradicional tem muita sobrecarga e complexidade nesta nova carga de trabalho, o que não conduz a melhorias adicionais no desempenho e na eficiência energética. Dados comparativos oficiais mostram que a solução Arm pode atingir mais que o dobro do desempenho do x86 em termos de desempenho por rack e tem o potencial de trazer até US$ 10 bilhões em economia de custos por gigawatt de potência de computação de data center de IA.

No nível ecológico e de implementação, Meta é o principal parceiro e principal implementador desta CPU AGI. Ele combinará o processador com seu acelerador MTIA autodesenvolvido para agendamento e orquestração de IA em grande escala em sua plataforma. Além da Meta, muitas empresas incluindo OpenAI, Cloudflare, Cerebras, Rebellions, SAP e SK Telecom confirmaram a adoção desta plataforma. Em termos de hardware, fabricantes como ASRock Rack, Lenovo, Quanta e Supermicro estão lançando produtos de servidores baseados nesta plataforma. O primeiro lote de sistemas foi fornecido a alguns clientes e espera-se que esteja disponível em maior escala no segundo semestre deste ano.

Arm disse que existem mais de 50 parceiros ecológicos por trás deste produto, incluindo serviços em nuvem, fabricação de chips e fabricantes de armazenamento como AWS, Google, Microsoft, NVIDIA, Samsung, TSMC e Micron, formando uma cadeia completa que abrange design, fabricação, sistemas de hardware e implantação em nuvem. Para Arm, o lançamento da CPU AGI não é apenas um layout técnico, mas também significa que seu papel se estende de "fornecedor de arquitetura" a "fornecedor de soluções completas", competindo por uma voz mais alta na nova rodada de competição de infraestrutura de data center de IA.