A Microsoft disse na terça-feira que seu modelo de inteligência artificial Phi-2 tem desempenho melhor do que produtos concorrentes de outras empresas como a Meta (MTEA) e pode ser executado em dispositivos. A Microsoft disse em um blog: "O modelo Phi-2 tem apenas 2,7 bilhões de parâmetros, mas em vários testes de benchmark abrangentes, seu desempenho excede o do modelo de linguagem grande (LLM) Mistral7B da startup europeia de IA Mistral, que tem 7 bilhões de parâmetros, e o modelo de IA Llama2 lançado pela Meta com 13 bilhões de parâmetros."
“Notavelmente, o modelo Phi-2 superou o Llama2 de 70 bilhões de parâmetros em tarefas de inferência de várias etapas (ou seja, codificação e matemática) (a família de modelos Llama2 inclui três variantes de parâmetros de 7 bilhões, 13 bilhões e 70 bilhões de parâmetros).”
A Microsoft acrescentou: “Além disso, o desempenho do modelo Phi-2 é comparável ou melhor do que o recentemente lançado Google Gemini Nano2, apesar do tamanho menor do modelo”. A Microsoft disse que o modelo Phi-2 será lançado no Azure Studio.
É relatado que a Microsoft lançou o modelo Phi-1 com apenas 1,3 bilhão de parâmetros em junho deste ano, que é adequado para cenários como perguntas e respostas de controle de qualidade, formato de bate-papo e código. O modelo é treinado inteiramente com dados de alta qualidade e supera modelos semelhantes em testes de benchmark em até 10 vezes.
A Microsoft atualizou e lançou a versão Phi-1.5 em setembro deste ano, que também possui 1,3 bilhão de parâmetros e pode escrever poemas, e-mails e histórias, além de resumir textos. Em benchmarks de bom senso, compreensão linguística e raciocínio, o modelo foi capaz de acompanhar modelos com até 10 mil milhões de parâmetros em algumas áreas.
Embora a escala do Phi-2, que a Microsoft lançou em uma atualização em novembro, tenha duplicado em comparação com a versão anterior, ainda é muito menor do que outros modelos de linguagem convencionais. A Microsoft afirma que o Phi-2 mostra melhorias significativas no raciocínio lógico e na segurança e, com o ajuste fino e a personalização corretos, os modelos de linguagem pequena são ferramentas poderosas para aplicativos de nuvem e de borda.