Há sinais de que a Intel encontrou novos contratempos no ecossistema de software de código aberto do seu acelerador Gaudi: SynapseAI Core, o projeto de código aberto responsável pelo suporte ao espaço do usuário Gaudi, foi arquivado e cessou a manutenção, lançando uma sombra sobre o futuro dos drivers de kernel relacionados.

imagem.webp

A Intel acaba de lançar o código do driver do kernel Habana Labs para o acelerador Gaudi 3 no final de novembro e está se preparando para submetê-lo ao upstream para integração na linha principal do kernel Linux. Anteriormente, esse trabalho de código aberto era repetidamente prejudicado por demissões e rotatividade de pessoal dentro da empresa, e o mantenedor do driver foi alterado muitas vezes, resultando em atrasos de longo prazo no suporte do kernel para Gaudi 3. Devido ao lançamento tardio do código, este driver não conseguiu acompanhar a janela de mesclagem do Linux 6.19 e só poderia ter como alvo as versões do Linux 6.20 ou mesmo 7.0.

O maior problema, porém, é a pilha de software no espaço do usuário. A Intel arquivou o SynapseAI Core no GitHub no início deste ano e marcou claramente na descrição do projeto que o projeto “não é mais mantido ativamente pela Intel”. A empresa não fornecerá mais suporte para desenvolvimento, reparos, atualizações ou aceitará patches. Ele também recomenda que os próprios usuários com necessidades contínuas bifurquem o código e o mantenham de forma independente. SynapseAI Core é uma biblioteca chave que fornece APIs de espaço de usuário em torno do hardware Gaudi. Inclui o back-end do Synapse, a biblioteca de conversão do espaço do usuário e outros componentes necessários para executar o código. É a camada básica de software que utiliza aceleradores e drivers upstream do kernel.

SynapseAI Core era originalmente de código aberto quando Habana Labs ainda era uma empresa independente. Naquela época, para atender aos requisitos upstream do kernel Linux, ele abriu a biblioteca básica do modo de usuário usada para cooperar com a operação do driver do kernel, a fim de concluir os testes e verificação funcional necessários para que o driver entrasse na linha principal. Agora que este projeto central de espaço de usuário está arquivado e não é mais mantido, isso significa que as perspectivas upstream do driver acelerador Gaudi no lado do kernel estão substancialmente ameaçadas pela ausência de suporte ao espaço de usuário de código aberto.

Esta situação também foi trazida para discussão na Linux Kernel Mailing List (LKML), com comentários afirmando que o suporte ao Gaudi 3 nunca foi realmente concluído e mesclado upstream até que o SynapseAI Core fosse arquivado. Se a situação atual não mudar, então, na ausência de uma pilha ativa de espaço de usuário de código aberto, o suporte do Gaudi 3 provavelmente enfrentará obstáculos para entrar com sucesso na linha principal no próximo ciclo de desenvolvimento do kernel.

Do lado de fora, essa mudança está intimamente relacionada ao recente controle de custos da Intel e à demissão da equipe de engenharia. A empresa obviamente não está disposta a continuar investindo recursos na manutenção desta parte do código-fonte aberto. Além disso, ainda existe uma pilha de software Gaudi de código fechado na Intel, e Gaudi 3 é considerado um dos nós finais desta linha de produtos. Interromper a manutenção de código aberto do SynapseAI Core provavelmente fará parte do “acabamento” geral e do desaparecimento gradual do suporte de software relacionado. Resta saber como o ecossistema de código aberto de Gaudi se desenvolverá no futuro.