De acordo com três pessoas familiarizadas com o projeto que estão profundamente envolvidas no projeto, seguindo o chip autodesenvolvido do concorrente OpenAI, a fim de tomar a iniciativa no caro sistema de computação por trás do modelo grande, o desenvolvedor Claude Anthropic iniciou o trabalho preparatório para chips de IA autodesenvolvidos e iniciou negociações com a Samsung Electronics, pretendendo usar a Samsung como um potencial parceiro de fundição de chips.

Se esta empresa de IA avançar oficialmente com seu projeto de chip de desenvolvimento próprio, a Anthropic só poderá ser considerada uma retardatária no campo de chips de IA de nível de servidor autodesenvolvidos. Google e Amazon AWS têm trabalhado arduamente há muitos anos e lançaram com sucesso chips de desenvolvimento próprio; Meta e Microsoft também lançaram processadores de desenvolvimento próprio. OpenAI juntou-se à Broadcom para iniciar o design de chips de desenvolvimento próprio já em 2024. No mês passado, o primeiro produto da cooperação entre as duas partes, o chip de inferência Jalapeño, foi lançado oficialmente. Este chip pode melhorar muito a eficiência operacional de modelos de linguagem grande.
Três pessoas familiarizadas com o assunto disseram que a Anthropic ainda está em fase de planejamento: não determinou o posicionamento funcional e as especificações de potência computacional deste processador, nem finalizou o plano de implantação do chip em servidores e clusters de servidores. Embora a empresa tenha iniciado intercâmbios com várias empresas de design de chips, ela ainda não entrou nas fases de projeto detalhado, testes e produção em massa.
A pesquisa e o desenvolvimento de processadores de IA são extremamente difíceis. Os engenheiros precisam levar em consideração as cinco dimensões de velocidade de computação, consumo de energia, memória, transmissão de rede e dissipação de calor. É duas vezes mais difícil conseguir uma produção em massa estável e em grande escala.
Este projecto de auto-investigação reflecte a tendência geral da indústria: as empresas de IA representadas pela Anthropic estão a tentar controlar firmemente a infra-estrutura subjacente de grandes modelos, cobrindo recursos de cadeia completa, tais como chips, contratos de serviços em nuvem, fornecimento de energia e centros de dados. Os modelos de IA em escala ultralarga precisam contar com enormes clusters de processadores para serem executados. Nessa escala, mesmo uma pequena melhoria na eficiência computacional pode reduzir significativamente os custos operacionais e liberar recursos computacionais escassos. Os chips de IA autodesenvolvidos também podem dar às empresas de IA mais poder de barganha na competição do setor por processadores, salas de computadores e recursos de energia.
Embora a Anthropic tenha começado a recrutar engenheiros de chips, o projeto de autopesquisa pode eventualmente ser arquivado. No início deste mês, a empresa recrutou com sucesso Clive Chen, um membro central da equipe de chips autodesenvolvidos de primeira geração da OpenAI.
Em resposta a entrevistas e perguntas da mídia, a Anthropic respondeu que os chips Trainium da Amazon AWS, as TPUs do processador Tensor do Google e as GPUs da Nvidia ainda são as principais escolhas de hardware da estratégia de expansão do poder de computação da empresa e não divulgaram mais detalhes sobre a rota dos chips autodesenvolvidos; A Samsung recusou-se a comentar esta negociação de cooperação.
A Samsung e a Anthropic há muito tempo mantêm laços de capital. Como fabricante líder mundial de chips de memória, em maio deste ano, a Samsung uniu forças com outros dois grandes gigantes de armazenamento, SK Hynix e Micron Technology, para participar do financiamento total da Anthropic de US$ 65 bilhões. Naquela altura, a oferta global de chips de memória excedia a procura e as empresas de electrónica de consumo, como a Apple, aumentavam os preços dos produtos. Este investimento estratégico permitiu à Anthropic vincular os principais fornecedores de chips de memória necessários para a expansão de seus próprios negócios.
A Coreia do Sul anunciou recentemente um plano de investimento industrial de 10 anos no valor de centenas de milhares de milhões, liderado pelo Grupo Samsung e pelo Grupo SK (as empresas-mãe da Samsung Electronics e da SK Hynix, respetivamente). As duas empresas investiram um total de US$ 518 bilhões para construir quatro novas fábricas de chips de memória na Coreia do Sul.
Se as duas partes finalizarem a cooperação na fundição, ela se tornará um pedido de grande sucesso com grande influência industrial para o negócio de fundição de wafers da Samsung. Embora a Samsung seja líder mundial em chips de memória, ela tem tentado expandir seu negócio de fundição de chips de IA e diminuir a lacuna com a TSMC - as linhas de produção de processos avançados desta última sempre foram a referência da indústria para a fabricação mundial de processadores de IA de ponta. Atualmente, os pedidos de chips de IA estão cheios e a capacidade de produção da TSMC é limitada. A Samsung entrou em um período de janela para promover seu processo de 2 nanômetros para mais clientes. A mídia informou anteriormente que o Google está considerando usar a Samsung para fabricar alguns de seus processadores tensores TPU de próxima geração.
Duas das três pessoas familiarizadas com o assunto revelaram que a Anthropic planeja usar a tecnologia de processo de 2nm e tecnologia de embalagem avançada da Samsung. 2nm é uma designação de processo industrial, não um tamanho físico. Representa uma das mais avançadas tecnologias de fabricação de chips, permitindo aos processadores alcançar maior integração e menor consumo de energia. A tecnologia avançada de empacotamento pode encurtar a distância física entre o processador principal e a memória de alta velocidade, aumentando significativamente a velocidade de transmissão de dados dentro do chip.
Há muito tempo, a estratégia competitiva diferenciada da Anthropic tem sido diversificar a compra de chips para servidores para evitar ser altamente dependente de hardware Nvidia como OpenAI e xAI. A empresa atualmente usa chips de servidor de IA da Amazon, Google e NVIDIA, e também está negociando o acesso a soluções de chips desenvolvidas pela Microsoft e pela startup britânica Fractile.
Embora o atual segmento de chips de inferência esteja crescendo em financiamento e várias empresas estejam se reunindo para pesquisa e desenvolvimento, os cálculos da mídia mostram que a participação de mercado da Nvidia aumentou em vez de cair nos últimos anos, atingindo 74%. O CEO da NVIDIA, Jensen Huang, insiste que o desempenho abrangente de seus próprios chips em cenários de inferência ainda está à frente de todos os produtos concorrentes.