A imagem física da nova geração do acelerador Ascend 950 AI da Huawei foi exposta pela primeira vez, mostrando a forma de embalagem do chip desenvolvido pela própria empresa e da memória de alta largura de banda (HBM) desenvolvida pela própria empresa. Este chip integra o HBM de primeira geração desenvolvido pela Huawei e uma nova geração de unidades de aceleração de IA no mesmo pacote. Ele está posicionado para clusters de computação em grande escala e compete por meio da escala do sistema e da densidade do cluster, em vez de rivais "hard-core" como a Nvidia em termos de desempenho de um único chip.

A Huawei anunciou anteriormente que a série Ascend 950 está programada para ser lançada oficialmente no início de 2026 e incluirá pelo menos dois modelos.

Os relatórios mostram que entre a série Ascend 950, a versão 950PR integra 128 GB de HBM desenvolvido pela própria Huawei, com uma largura de banda de aproximadamente 1,6 TB/s; enquanto a versão 950DT aumenta a capacidade para 144 GB e aumenta significativamente a largura de banda para quase 4 TB/s. As metas de poder de computação de ambos os chips são desempenho FP8 de nível 1 PetaFLOPS e desempenho FP4 de nível 2 PetaFLOPS para uma única placa, visando cenários atuais de inferência e treinamento de grandes modelos. A estratégia geral da Huawei coloca mais ênfase em embalagens de alta densidade e redes de interconexão eficientes, e compensa a lacuna no desempenho de chip único, melhorando o poder de computação e a eficiência de interconexão nos níveis de gabinete e data center.

Em termos de processo de fabricação, o artigo aponta que atualmente não há informações oficialmente confirmadas sobre o nó do processo, mas a indústria geralmente espera que o Ascend 950 provavelmente use o mais recente processo N+3 da SMIC, que é classificado como um nó de 5 nm. A SMIC anunciou anteriormente que seu nó N+3 alcançou produção em massa sem depender de equipamentos EUV, e o primeiro cliente público é o produto terminal da Huawei equipado com Kirin 9030 SoC. Neste contexto, como produto estratégico de aceleração de IA da Huawei, é considerado uma inferência “natural” que o Ascend 950 utilize o mesmo nó.

Pela imagem física, o Ascend 950 adota um design de embalagem multi-chip. O núcleo é composto por duas matrizes de chip de computação e é emparelhado com duas E/S suspeitas adicionais e matrizes de chip relacionadas à rede para formar um módulo multichip (MCM). Acredita-se que esses chips de E/S e de rede sejam responsáveis ​​por conectar placas aceleradoras a clusters SuperPoD e SuperCluster maiores, alcançando interconexão de alta largura de banda de centenas de milhares de placas Ascend 950 por meio de uma nova geração de protocolo de interconexão "Lingqu" e tecnologia de interconexão óptica. Especula-se que o módulo com um anel de estrutura de embalagem distribuído ao redor da matriz que se parece com a "forma híbrida LPDDR/HBM" seja o pacote HBM desenvolvido pela própria Huawei. Provavelmente é produzido em um pacote independente e depois empilhado e integrado no substrato do acelerador em um pacote de nível de sistema.

No geral, a rota de design do Ascend 950 tem algumas semelhanças com GPUs de última geração, como NVIDIA Blackwell. Ambos usam pacotes de chip duplo para sobrepor mais poder de computação em uma única placa e contam com HBM de alta largura de banda e protocolos de interconexão dedicados para construir clusters de computação em grande escala. A diferença é que a Huawei está mais focada na ideia de "ganhar em escala" no estágio atual, na esperança de formar soluções alternativas nos mercados de data center e de energia de computação em nuvem de IA por meio de embalagens densas, interconexão de vários cartões e soluções de supercluster, ao mesmo tempo que fortalece a controlabilidade independente da cadeia de abastecimento local.