A Microsoft anunciou recentemente que seu primeiro lote de chips de IA autodesenvolvidos "Maia 200" foi oficialmente colocado em uso em um data center e planeja expandir ainda mais a implantação global nos próximos meses. Este chip é posicionado pela Microsoft como um "mecanismo de poder de raciocínio de IA" para cenários de raciocínio e é otimizado principalmente para cargas de trabalho de nível de produção de alta intensidade, como raciocínio on-line de modelos grandes. Indicadores de desempenho divulgados pela Microsoft mostram que o Maia 200 pode superar o mais recente chip Trainium da Amazon e o TPU de última geração do Google em termos de velocidade de processamento. O objetivo é aproveitar a vantagem tecnológica na competição por chips de aceleração de IA autodesenvolvidos por fabricantes de nuvem.

Um pano de fundo importante para os chips de IA autodesenvolvidos pela gigante da computação em nuvem é o alto custo atual e o fornecimento limitado das mais recentes GPUs de ponta de fabricantes como a Nvidia. Este estrangulamento da oferta ainda será difícil de resolver a curto prazo. No entanto, mesmo que tenha chips de IA de alto desempenho desenvolvidos por conta própria, a Microsoft não deixará de comprar chips da Nvidia e da AMD. O CEO da Microsoft, Satya Nadella, disse que a empresa mantém uma “grande parceria” com a Nvidia e a AMD, e ambas as partes continuam a promover a inovação em seus respectivos campos. Na sua opinião, a opinião do mercado está frequentemente interessada em comparar “quem está à frente”, mas a verdadeira chave é manter a liderança durante um longo período de tempo.

Nadella destacou ainda que a Microsoft tem capacidade de integração vertical, mas isso não significa que a empresa utilizará apenas a sua própria tecnologia de cima para baixo e abandonará completamente as soluções dos parceiros ecológicos. Em outras palavras, além dos chips de desenvolvimento próprio, a Microsoft ainda contará com um portfólio diversificado de hardware de fornecedores como Nvidia e AMD para apoiar suas crescentes necessidades de computação em nuvem de IA.

Pelo acordo da Microsoft, o Maia 200 terá prioridade para a equipe interna de “Superinteligência” da empresa. A equipe, liderada pelo ex-cofundador do Google DeepMind, Mustafa Suleiman, é responsável pela construção de uma nova geração de grandes modelos de ponta para a Microsoft. Acredita-se geralmente que o investimento da Microsoft na construção dos seus próprios modelos de ponta visa reduzir a sua dependência de fornecedores de modelos terceiros, como OpenAI e Anthropic, até certo ponto, no futuro. Suleiman postou na plataforma social

Ao mesmo tempo, o Maia 200 também suportará modelos OpenAI executados na plataforma de nuvem Microsoft Azure, proporcionando aos clientes da nuvem mais opções de poder de computação de IA. No entanto, o feedback de todas as partes mostra que a obtenção dos recursos de hardware de IA mais avançados ainda é um problema comum enfrentado por toda a indústria. Essa situação tensa não afeta apenas os clientes pagantes, mas também as equipes internas de P&D de IA dos fornecedores de nuvem. Num tal ambiente de fornecimento, a Microsoft está a acelerar a implementação de chips de aceleração de IA auto-desenvolvidos, por um lado, e por outro lado, continua a aumentar as compras da NVIDIA e da AMD para garantir as necessidades duplas da sua infra-estrutura de IA em termos de expansão de escala e optimização de desempenho.