A próxima geração de GPU Feynman da NVIDIA está prestes a estrear: o primeiro processo de 1,6 nm, consumo de energia de mais de 1000 W

A NVIDIA realizará a conferência GTC deste ano na próxima semana, de 16 a 19 de março. Espera-se o lançamento de pelo menos dois produtos de grande sucesso, um é um LPU voltado para o raciocínio e o outro é a arquitetura de GPU de próxima geração Feynman. Feynman (físico Feynman) ainda usa o sistema anterior que leva o nome do famoso cientista. Na verdade, a sua existência foi mencionada no roteiro do ano passado, mas havia muito pouca informação. Mencionou apenas a notícia de combinar a memória HBM da próxima geração.

De acordo com as últimas notícias, a placa gráfica Feynman será lançada com o processo A16 da TSMC.Este é o primeiro processo de nível 1,6 nm do mundo e o primeiro processo da TSMC a usar fonte de alimentação traseira SRP., esta tecnologia pode não apenas melhorar a densidade e o desempenho, mas também melhorar a capacidade de fornecimento de energia, principalmente para computação de alto desempenho HPC.

No entanto, o processo OEM A16 é caro. Foi relatado que a NVIDIA planeja transferir alguns pedidos de embalagens para a Intel e usar a tecnologia de empacotamento EMIB-T desta última, em vez de depender inteiramente do pacote CoWoS da TSMC para reduzir custos e aumentar a capacidade de produção.

As placas gráficas Feynman levarão o desempenho da IA a novos patamares, mas também trazem muitos problemas. O primeiro é o consumo de energia. A arquitetura atual da Blackwell está próxima de 1000W, e o consumo de energia do Blackwell Ultra de renda dupla chega até a 1400W.Feynman também atingirá mais de 1.000 W, e as placas dual-core podem ter que atingir 2.000 W.

O aumento no consumo de energia levará naturalmente a um melhor desempenho, mas também haverá problemas de dissipação de calor. Vera Rubin deixou claro que todo resfriamento líquido será usado para dissipação de calor, e Feynman também deveria recorrer a um resfriamento líquido mais eficiente.

Outra mudança é que Feynman integrará a tecnologia LPU da Groq, mas pessoalmente acho que não é necessariamente esse o caso. A principal razão é que a arquitetura Feynman deveria ter concluído o design, e todo o LPU é tarde demais, e a NVIDIA obviamente construirá o LPU em uma linha de produtos independente. Afinal, os requisitos para chips de IA em cenários de treinamento e inferência são diferentes e precisam ser tratados separadamente.

Para os jogadores, as placas gráficas Feynman estarão longe, por melhores que sejam, porque Feynman é para 2028.Os cartões de jogo ainda serão atualizados para a arquitetura Rubin no segundo semestre do próximo ano, e os cartões de jogo Feynman não estarão disponíveis até pelo menos 2029.