NVIDIA lançará um novo chip LPU no país: sem downgrade, sem fornecimento especial, 40PB/s performance

Na conferência GTC de ontem, a NVIDIA lançou uma série de sistemas de IA e lançou oficialmente um novo chip LPU - Groq 3 LPU, que é o produto da aquisição da tecnologia Groq por US$ 20 bilhões no ano passado. Comparado com chips GPU de IA que se concentram no treinamento pesado de modelos, o Groq 3 LPU é projetado para inferência de IA e tem as vantagens de baixa latência e longo contexto. Pode ser usado em conjunto com Vera Rubin para apoiar todo o processo de IA.

A boa notícia é que este chip LPU também deverá ser usado na China.A mídia estrangeira citou fontes dizendo que a NVIDIA está se preparando para lançar um chip Groq que pode ser vendido no mercado interno.

Ao contrário dos chips GPU anteriores, que precisavam ter seu desempenho reduzido antes de poderem ser exportados,Desta vez o chip Groq não terá especificações castradas, e não é uma versão especial nacional como o H20.

Sem castração ou fornecimento especial, esses chips Groq obviamente reduzirão muita resistência quando vendidos no mercado interno. No entanto, o maior problema é se ele conseguirá passar na revisão dos EUA. Depende de como Huang Renxun convence o presidente dos EUA.

Mas dito isso, mesmo que a NVIDIA não forneça chips Groq especificamente para a China, é difícil dizer que os chips Groq lançados na China no futuro serão o LPU Groq 3 lançado ontem, porque o desempenho e as especificações atuais deste último também são muito fortes.

O chip único deste produto é chamado LPU30, fabricado pela Samsung OEM, integrando cache SRAM de 500 MB, 98 bilhões de transistores, caractere FP8 1.2PFLOPS, o desempenho da computação AI é muito inferior ao GPU Rubin, mas a largura de banda de 150 TB/s é muito maior do que os 22 TB/s do HBM4.

O chip Groq 3 LPU aparecerá na forma de rack Groq 3 LPX, que pode integrar 256 chips LPU30 com capacidade de cache de 128 GB.A largura de banda total da memória foi aumentada para 40 PB/s, a largura de banda de interconexão também é de 640 TB/s.

Em geral, a LPU não pode ser comparada à GPU em termos de poder de computação de IA, mas a largura de banda da SRAM sem dúvida supera o HBM4 e a latência é menor. Os dois chips são adequados para situações diferentes. Não é uma questão de quem substitui o outro. As vendas de LPU explodirão no futuro.