Pesquisadores da Microsoft afirmam ter desenvolvido o maior modelo de inteligência artificial de 1 bit até hoje, também conhecido comoBitnets". O modelo é denominado BitNet b1.58 2B4T e é licenciado sob a licença MITDisponível publicamente, pode ser executado em CPUs, incluindo Apple M2.

GonbYmHXUAAkfV_.jpg

Bitnets são essencialmente um modelo de compressão projetado para rodar em hardware leve. Nos modelos padrão, os pesos (valores que definem a estrutura interna do modelo) são frequentemente quantizados para que o modelo tenha um bom desempenho em diversas máquinas. A quantização de pesos reduz o número de bits (as menores unidades que um computador pode processar) necessários para representar esses pesos, permitindo que os modelos rodem mais rapidamente em chips com menos memória.

Bitnets quantizam pesos em três valores: -1, 0 e 1. Em teoria, isso os torna mais memória e computacionalmente eficientes do que a maioria dos modelos atuais.

Os pesquisadores da Microsoft dizem que o BitNet b1.58 2B4T é o primeiro BitNet a ter 2 bilhões de parâmetros, com “parâmetros” sendo em grande parte sinônimo de “pesos”. Os pesquisadores afirmam que o BitNet b1.58 2B4T, treinado em um conjunto de dados de 4 trilhões de tokens (estimado em cerca de 33 milhões de livros), supera os modelos tradicionais de tamanho semelhante.

Para ser claro, o BitNet b1.58 2B4T não supera exatamente o modelo de 2 bilhões de parâmetros da concorrência, mas parece se manter. De acordo com os testes dos pesquisadores, o modelo superou o Llama 3.2 1B da Meta, o Gemma 3 1B do Google e o Qwen 2.5 1.5B do Alibaba em benchmarks incluindo GSM8K (um conjunto de questões de matemática do ensino fundamental) e PIQA (um teste de habilidades de raciocínio de senso comum em física).

Talvez ainda mais impressionante, o BitNet b1.58 2B4T é mais rápido do que outros modelos de tamanho semelhante – em alguns casos, duas vezes mais rápido – enquanto usa apenas uma fração da memória.

No entanto, há um problema. Alcançar esse tipo de desempenho requer o uso da estrutura personalizada bitnet.cpp da Microsoft, que atualmente funciona apenas em determinados hardwares. As GPUs, que dominam o mundo da infraestrutura de IA, ainda não foram incluídas na lista de chips suportados.

Resumindo,BitnetsO futuro pode ser brilhante, especialmente para dispositivos com recursos limitados, mas a compatibilidade ainda é uma questão fundamental e provavelmente continuará sendo.