A mais recente cooperação entre Kioxia e NVIDIA é considerada mais um avanço tecnológico na infraestrutura de data center de IA. As duas empresas estão trabalhando juntas para desenvolver SSDs que possam fornecer até 100 milhões de IOPS (operações de entrada e saída por segundo). Este desempenho é muito superior ao atual nível superior de SSD de cerca de 3 milhões de IOPS, com o objetivo de superar o gargalo de transmissão de dados no treinamento e implantação de modelos de IA em larga escala.
Se o projeto for bem-sucedido, não só acelerará o ritmo da inovação da IA generativa (GenAI), mas também redefinirá a arquitetura do data center, mudará o cenário competitivo da computação em nuvem e do armazenamento de classe empresarial e estabelecerá novos padrões para todo o ecossistema de hardware.

O fabricante de memórias semicondutoras Kioxia está desenvolvendo uma nova geração de tecnologia SSD para atender às necessidades de leitura e gravação de alta intensidade da IA. A empresa anunciou que planeja atingir a comercialização em 2027, para que o IOPS aleatório do SSD chegue a 100 milhões de vezes. Este indicador de desempenho é aproximadamente 30 a 35 vezes maior que o dos produtos de alta qualidade existentes. Desta vez, Kioxia coopera com a NVIDIA para promover a implementação do projeto.
Em uma coletiva de imprensa em Tóquio, Kioxia disse que o novo SSD será conectado diretamente às GPUs NVIDIA sem passar por um processador central de servidor tradicional. Este método de conexão "ponto a ponto" melhora muito a velocidade do fluxo de dados entre as unidades de armazenamento e de computação. É especialmente adequado para treinamento de grandes modelos de IA que dependem de leitura frequente e aleatória de dados em pequena escala, como recuperação de representações incorporadas e parâmetros de modelo. Os sistemas SSD tradicionais são difíceis de lidar eficientemente com essas necessidades.
A NVIDIA estabeleceu uma meta mais desafiadora: atingir 200 milhões de IOPS por meio de dois SSDs com suporte para o próximo padrão PCI Express 7.0. PCIe 7.0 traz recursos de comunicação de GPU ponto a ponto de maior velocidade. Em comparação, o atual SSD de alto desempenho atinge cerca de 3 milhões de IOPS em blocos de 4K. Se saltar para 100 milhões de IOPS, trará grandes desafios técnicos tanto para a memória flash NAND quanto para a arquitetura de interface.
A tecnologia mais promissora da Kioxia é seu armazenamento NAND de célula de camada única (SLC) XL-Flash proprietário, que possui características de alta resistência, baixa latência e forte desempenho. Cada chip XL-Flash suporta até 16 "planos", enquanto o 3D NAND comum de consumo geralmente tem de 3 a 6 planos.
Embora a Kioxia não tenha divulgado todas as especificações técnicas, os dados de teste existentes podem dar uma ideia da escala do desafio: um SSD XL-Flash de 400 GB equipado com 32 chips NAND e usando a interface PCIe 5.0 demonstrou um desempenho de aproximadamente 3,5 milhões de IOPS de leitura aleatória. Teoricamente, se o desempenho puder ser dimensionado de forma perfeitamente linear, então um SSD equipado com 915 chips poderá atingir 100 milhões de IOPS. No entanto, na verdade, devido a fatores como largura de banda do controlador, sobrecarga de firmware e arquitetura do sistema, esse objetivo é muitas vezes difícil de alcançar simplesmente empilhando chips e pode exigir o uso de vários controladores ou soluções SSD modulares.
Dadas as limitações da expansão 3D NAND tradicional, a Kioxia também está explorando uma nova tecnologia de armazenamento chamada flash de alta largura de banda (HBF), que visa combinar a velocidade da memória de alta largura de banda com maior capacidade de armazenamento. A solução HBF utiliza empacotamento avançado para empilhar até 16 chips NAND e um chip lógico para atingir níveis extremamente altos de paralelismo e largura de banda. Embora ainda seja incerto se o HBF será utilizado no produto final deste projeto de cooperação, esta pesquisa e desenvolvimento mostra que a Kioxia está apresentando soluções de armazenamento de altíssimo desempenho na era da IA.