Em 26 de fevereiro, terceiro dia da Open Source Week, DeepSeek anunciou a inauguração da eficiente biblioteca FP8GEMM DeepGEMM. Os lançamentos do DeepSeek nos últimos três dias estão todos relacionados a algoritmos e são mais técnicos.
Chen Ran, fundador da grande comunidade ecológica modelo OpenCSG (Open Expression), deu um exemplo ao China Business News: "No passado, DeepSeek deu diretamente um carro e disse a todos que o carro tinha um alcance de 900 quilômetros, mas agora DeepSeek está se aprofundando para descobrir como ele pode dirigir até 900 quilômetros." Por que o modelo DeepSeek pode alcançar melhores resultados, existem alguns algoritmos e estruturas correspondentes, e o código aberto desses "andaimes" é propício para a futura construção ecológica.
Específico para as palavras-chave lançadas desta vez, GEMM (General Matrix Multiplication) é uma operação básica em álgebra linear, enquanto FP8GEMM é uma operação de cálculo que usa números de ponto flutuante de 8 bits para multiplicação de matrizes. FP8 é um formato de ponto flutuante de baixa precisão adequado para aprendizado profundo e computação de alto desempenho. Ele pode reduzir o uso de memória e os requisitos de largura de banda, ao mesmo tempo que mantém alta eficiência computacional.
De acordo com DeepSeek, DeepGEMM suporta modelos densos tradicionais e operações GEMM de modelos MoE (Mixed Expert). Este código fornece treinamento eficiente e suporte de inferência para hardware da série V3/R1 baseado na arquitetura NVIDIA Hopper (como H100GPU).
DeepSeek mencionou que com base nesta base de código, o desempenho de 1350+FP8TFLOPS (operações de ponto flutuante por segundo) pode ser alcançado na GPU da arquitetura NVIDIA Hopper, fazendo uso total do poder de computação. Ao mesmo tempo, o design da base de código é muito simples, com apenas uma função central do kernel e um tamanho de código de cerca de 300 linhas, mas supera os kernels ajustados por especialistas na maioria dos tamanhos de matriz.
Qual é o impacto do DeepGEMM de código aberto? O repórter fez esta pergunta ao DeepSeek, que respondeu que o DeepGEMM resolveu os pontos problemáticos da eficiência da computação de grandes modelos e do consumo de recursos por meio do FP8 e da otimização no nível de hardware, e especialmente forneceu suporte fundamental para a implementação do modelo MoE. Seu comportamento de código aberto não só acelera a democratização da tecnologia, mas também pode se tornar a "infraestrutura" do ecossistema de computação de IA e promover o desenvolvimento da indústria em uma direção mais eficiente e de baixo custo.
FP8 é um padrão emergente para computação de IA. Sua alta eficiência pode acelerar o treinamento de centenas de bilhões de modelos de parâmetros e reduzir os requisitos de memória de vídeo. Quando implantados em dispositivos de ponta ou na nuvem, os cálculos de baixa precisão do FP8 podem melhorar significativamente o rendimento e reduzir custos. Portanto, o DeepGEMM de código aberto pode promover a popularização da ecologia do FP8, reduzir o limite para uso dos desenvolvedores, promover mais estruturas e modelos para se adaptar ao FP8 e acelerar a migração da indústria para a computação de baixa precisão.
Além disso, os modelos MoE são difíceis de implementar devido à complexidade computacional. O código aberto do DeepGEMM fornece uma referência de implementação eficiente, que pode levar a mais aplicações MoE (como modelos multimodais, modelos eficientes de ponta).
Em relação à base de código-fonte aberto do DeepSeek por três dias consecutivos, Chen Ran disse aos repórteres: “Estamos bastante chocados com isso”. O objetivo final do DeepSeek é mostrar como seu R1 e V3 são feitos. Ele acredita que os algoritmos atualmente lançados pela DeepSeek são, em certo sentido, “andaimes”. “Devemos dar a todos um ‘andaime’ para que todos possam continuar a usar a linha de tecnologia baseada no DeepSeek e, em última análise, a indústria possa construir um ecossistema baseado nisso.”
No longo prazo, Chen Ran acredita que a iniciativa de código aberto do DeepSeek é muito significativa. Possui padrões de modelo, padrões de ferramentas e pilares ecológicos, para que o ecossistema possa crescer.
Chen Ran julgou que o código aberto do DeepSeek pode afetar um grupo de profissionais que trabalham na camada AIInfra. "O DeepSeek basicamente fornece a pilha de tecnologia e os modelos, mas faltam dados, mas outros também podem reproduzir os dados. As pessoas na camada AIInfra terão que encontrar novas direções." Mas ele também disse que esse tipo de código aberto é uma faca de dois gumes. Se você puder fazer bom uso do conteúdo de código aberto do DeepSeek, também poderá se beneficiar. “Se você não usar bem, você será atingido.”
Alguns profissionais também disseram aos repórteres que o código aberto do DeepSeek é a aceleração de inferência da camada Infra. O código aberto da tecnologia subjacente do DeepSeek terá um impacto sobre os profissionais, mas pode não ser muito grande.
“O impacto do DeepSeek na indústria apenas começou e ninguém pode adivinhar o resultado.” disse o praticante acima mencionado.
DeepSeek anunciou anteriormente que abrirá 5 bibliotecas de código, uma após a outra. A seguir, DeepSeek lançará mais duas bibliotecas de código esta semana. “Cada linha de código compartilhada se tornará uma motivação coletiva para acelerar o desenvolvimento da indústria de IA.” DeepSeek disse no anúncio.