A Microsoft está afrouxando uma “linha dura” que traçou anteriormente em torno dos PCs Copilot +, permitindo que mais dispositivos Windows 11 executem cargas de trabalho de IA nativas se tiverem a GPU certa.A atualização mais recente mostra que os sistemas com NVIDIA GeForce RTX série 30 ou placa gráfica mais recente com pelo menos 6 GB de memória de vídeo suportarão a API do modelo de idioma local do Windows. Superficialmente, esta é apenas uma pequena mudança para os desenvolvedores, mas sugere que a Microsoft está repensando se deve vincular firmemente seus recursos nativos de IA à marca Copilot +.

Quando o Copilot+ PC foi lançado oficialmente em 18 de junho de 2024, a mensagem da Microsoft foi muito clara: hardware de IA dedicado é um requisito. Alguns dos recursos que definem esse tipo de dispositivo são unidades de processamento neural (NPUs) integradas, bem como configurações básicas, como 16 GB de memória e unidades de estado sólido. Entre eles, o NPU é deliberadamente moldado como a chave para desbloquear os recursos de IA nativos do Windows.
No entanto, as NPUs não são as únicas capazes de lidar com cargas de trabalho de IA. As GPUs modernas, em particular, são construídas para computação massivamente paralela e têm sido usadas há muito tempo para executar modelos de aprendizado de máquina. Na prática, para muitas cargas de trabalho de IA, as GPUs muitas vezes podem fornecer capacidades de rendimento mais altas do que as NPUs atuais, muitas vezes ao custo de um maior consumo de energia.
Antes deste ajuste, a Microsoft limitava a maioria dos recursos integrados de IA a dispositivos com NPUs. Isso evita que muitos PCs com poder de computação suficiente e que dependem apenas de GPUs usem a geração local de texto e imagem, bem como uma série de ferramentas de IA, como o Windows Recall. Hoje, essa lacuna está começando a ser superada. A Microsoft confirmou em um documento técnico atualizado e em uma postagem no GitHub que os desenvolvedores agora podem executar a API do modelo de linguagem em PCs não Copilot+ com GPUs suportadas.
Em sua introdução, a Microsoft chama esse recurso de “APIs de modelo de linguagem executadas em GPUs (experimentais)”, observando que essas APIs agora podem ser executadas em PCs não Copilot+ com GPUs suportadas, trazendo recursos de modelo de linguagem nativo para uma gama mais ampla de dispositivos Windows 11. O responsável também esclareceu que o hardware atualmente suportado inclui NVIDIA GeForce RTX série 30 e produtos mais recentes equipados com mais de 6 GB de memória de vídeo.
No estágio atual, esse recurso ainda está principalmente no nível do desenvolvedor e não está diretamente aberto aos usuários finais comuns. Para chamar essas APIs, você precisa desenvolver ou usar um aplicativo que integre o Windows AI Framework. No entanto, isso lançou as bases para a expansão massiva dos recursos nativos de IA para mais dispositivos Windows.
No centro desta estrutura está um pequeno modelo de linguagem local chamado Phi Silica. Em vez de ser pré-instalado em todos os sistemas, o Phi Silica é distribuído sob demanda via Windows Update: o modelo é baixado apenas quando um aplicativo o solicita. Depois que o modelo estiver instalado, ele poderá ser executado em hardware local. Quando uma GPU disponível for detectada, a GPU será usada primeiro para acelerar a inferência.
As funções divulgadas atualmente concentram-se principalmente em tarefas relacionadas a texto. Por meio da API Windows.AI.Text, os aplicativos podem realizar operações como resumo de conteúdo, reescrita de texto, conversão de texto em um formato estruturado e geração de prompts. Do ponto de vista do usuário, esses recursos são semelhantes à experiência fornecida pelas ferramentas de IA em nuvem, exceto que os cálculos são concluídos inteiramente localmente.
A execução local traz algumas vantagens práticas. Ao reduzir a dependência do poder da computação em nuvem, espera-se que a velocidade de resposta do sistema seja melhorada. Ao mesmo tempo, os dados não precisam ser carregados em servidores externos, o que ajuda os dados a permanecerem na máquina local. Este modelo é potencialmente atraente para desenvolvedores e usuários corporativos em termos de latência, custos de largura de banda e conformidade com a privacidade, o que pode impactar a forma como eles adotam os recursos de IA.
Ressalta-se que esta abertura não significa que o sistema Copilot+ esteja totalmente “desbloqueado”. Alguns dos recursos mais visíveis do Copilot+, como Windows Recall e Click to Do, ainda estão vinculados a sistemas com NPU. Da forma como está, o suporte à GPU é limitado principalmente à camada API do modelo de linguagem, em vez da integração total em toda a experiência de IA.
Embora as limitações permaneçam, a tendência já é clara: a Microsoft não vê mais o NPU como o único ponto de entrada para a IA nativa do Windows. Permitir que a GPU lide com esta parte da carga de trabalho expande significativamente a gama de hardware compatível e enfraquece a imagem de “somente IA nativa” que o Copilot+ PC tinha no lançamento.