O processador Intel Xeon 6 entra oficialmente no carro-chefe da nova geração da NVIDIA host

Na conferência NVIDIA GTC 2026 em San Jose,A Intel anunciou oficialmente uma grande cooperação, e seu processador Xeon 6 (Xeon 6) se tornará a CPU host do principal sistema de servidor de IA da próxima geração da NVIDIA, DGX Rubin NVL8.

Esta cooperação leva a cooperação entre as duas empresas na arquitetura x86 um passo adiante. Anteriormente, na plataforma baseada no DGX B300 Blackwell, as duas partes estabeleceram cooperação na arquitetura x86 usando o processador Xeon 6776P. Isso também significa que a Intel “abraçou” a NVIDIA com sucesso e ganhou uma posição firme no campo de servidores de IA.

É relatado que,DGX Rubin NVL8 é o principal sistema de servidor de IA da nova geração da NVIDIA, com foco em cenários de aplicativos emergentes, como IA de agente e sistemas de inferência. Neste sistema, a CPU host desempenha um papel crucial e é a principal responsável pela orquestração de tarefas, gerenciamento de memória, agendamento e transmissão de dados para o acelerador GPU.

À medida que as cargas de trabalho de inferência de IA se transformam gradualmente em IA de agente e sistemas de inferência, essas tarefas têm requisitos cada vez mais altos para desempenho de núcleo único e largura de banda de memória.

A Intel disse que o processador Xeon 6 pode atender a essas necessidades por meio de melhorias abrangentes na capacidade de memória, largura de banda e desempenho de E/S. O processador é construído em uma plataforma que pode suportar até 8 TB de memória de sistema, o que a Intel diz ser particularmente crítico para suportar grandes modelos de linguagem à medida que os caches de valores-chave continuam a se expandir.

Com a ajuda da tecnologia MRDIMM, a largura de banda da memória foi aumentada 2,3 vezes em comparação com a geração anterior, o que pode aumentar significativamente a velocidade de transmissão de dados para o acelerador GPU.

Ao mesmo tempo, o canal PCIe 5.0 permite conexões de acelerador de alta largura de banda, e a função "Priority Core Turbo" da Intel também pode concentrar o poderoso desempenho de thread único em tarefas de orquestração, agendamento e transmissão de dados, garantindo que a GPU mantenha alta utilização mesmo se a carga de trabalho se tornar mais complexa.

Em termos de segurança e compatibilidade, o processador Xeon 6 pode fornecer proteção de segurança para todo o caminho de dados da CPU à GPU por meio do Intel Trusted Domain Extensions (TDX). Entre eles, a tecnologia TDX adicionará funções de isolamento e autenticação baseadas em hardware por meio de buffers de recuperação criptografados, que podem atender às necessidades de computação confidencial de ponta a ponta quando a inferência de IA é implantada em vários cenários, como data centers, nuvens e bordas. Além disso, o Xeon 6 também adiciona suporte para a estrutura de orquestração de inferência NVIDIA Dynamo. Com esta estrutura, os recursos de CPU e GPU no mesmo cluster podem ser agendados de forma heterogênea.

"Nesta nova era, o papel da CPU hospedeira é crucial." Jeff McVeigh, vice-presidente e gerente geral de projetos estratégicos de data center da Intel, disse que isso determina diretamente a eficiência de orquestração, velocidade de acesso à memória, segurança do modelo e rendimento do sistema acelerado por GPU.

A Intel também mencionou que o ecossistema de software x86 maduro do processador Xeon, a rica experiência de implantação empresarial e a boa compatibilidade com as pilhas de software de IA existentes são os principais motivos pelos quais a NVIDIA o escolheu.

Esta cooperação entre as duas partes segue a mesma base arquitetônica do DGX B300, permitindo que as duas gerações de produtos Blackwell e Rubin alcancem continuidade no nível da plataforma, e espera-se que promova a implementação em larga escala da tecnologia de inferência de IA em data centers, nuvens, bordas e outros cenários.