A IBM desenvolveu uma nova tecnologia óptica que pode treinar modelos de IA na velocidade da luz e, ao mesmo tempo, economizar enormes quantidades de energia. A empresa afirma que, ao aplicar a sua tecnologia inovadora aos centros de dados, pode poupar energia equivalente ao consumo anual de energia de 5.000 lares nos EUA ao treinar modelos de IA.

A empresa explicou que embora o data center esteja conectado ao mundo externo por meio de cabos de fibra ótica, internamente ainda utilizam fios de cobre. Esses fios conectam aceleradores de GPU, que ficam muito tempo ociosos enquanto aguardam dados de outros dispositivos, consumindo energia e aumentando custos.

Comentando sobre o desenvolvimento, Dario Gil, vice-presidente sênior e diretor de pesquisa da IBM, disse:

"Como a geração de IA requer mais energia e poder de processamento, os data centers devem continuar a evoluir - e a óptica integrada pode preparar esses data centers para o futuro. Com esta inovação, os futuros chips se comunicarão como cabos de fibra óptica transportando dados para dentro e para fora dos data centers, inaugurando uma nova era de comunicações mais rápidas e sustentáveis ​​que podem lidar com futuras cargas de trabalho de IA."

A IBM descreveu seu novo protótipo de óptica co-packaged (CPO) em um artigo técnico. Ao aumentar significativamente a largura de banda do data center, o tempo de inatividade da GPU pode ser minimizado, acelerando assim o processamento de IA.

A IBM explica que o tempo de treinamento do modelo de linguagem grande (LLM) pode ser reduzido de três meses para três semanas. Ao mesmo tempo, melhorar a eficiência energética reduzirá o uso de energia e diminuirá os custos associados à formação LLM.