Microsoft lança AI Dev Gallery para facilitar a execução nativa de modelos de IA no Windows 11

Copilot+PC é o primeiro computador a executar modelos de linguagem pequena (SLM) no dispositivo. A vantagem dessa abordagem é que ela produz resultados para tarefas como geração de imagens ou texto muito mais rápido do que o aplicativo Copilot baseado em nuvem. Agora, a Microsoft lançou o AIDevGallery, uma maneira fácil de integrar recursos de inteligência artificial no dispositivo em qualquer aplicativo.

O aplicativo AIDevGallery é para desenvolvedores que desejam experimentar vários modelos para integrar recursos de inteligência artificial em seus aplicativos. O aplicativo oferece mais de 25 amostras que os usuários podem baixar e executar em seus dispositivos. Além disso, projetos ou códigos-fonte podem ser exportados diretamente para o aplicativo e executados imediatamente. Funciona no Windows 10 e 11 e oferece suporte às arquiteturas x64 e ARM64.

Atualmente, a única maneira de acessá-lo é compilar o projeto no Visual Studio e depois executá-lo. Além disso, são necessários pelo menos 20 GB de espaço e uma CPU multi-core. Também recomenda uma GPU com 8 GB de VRAM.

O aplicativo possui dois modos: amostra e maquete, e o programa os divide em texto, imagens, código, áudio e vídeo e controles inteligentes.

modelo de teste

Os modelos para geração de imagens e geração de vídeos são bastante grandes, chegando perto de 5GB. Começamos com um modelo pequeno relacionado ao upscaling, que tem menos de 100 MB. Tiramos uma captura de tela e tentamos escalá-la usando a CPU, alternando entre CPU e GPU para lidar com as solicitações enquanto trabalhávamos.

Nesta máquina virtual de baixa configuração, o processo de dimensionamento levou menos de 30 segundos e o consumo de memória subiu instantaneamente para 1 GB. O aplicativo exibe uma versão ampliada da imagem com resolução de 9272*4900. Os elementos gráficos, especialmente o texto, são gravemente afetados e difíceis de ler.

Não há opção de visualizar a imagem gerada em uma janela maior ou em tela inteira. Nem mesmo uma opção de download para salvá-lo em disco

Tentamos outro modelo chamado DetectHumanPose. Pode identificar a localização de alguém em uma imagem. Embora tenha conseguido identificar com precisão uma pessoa básica andando, ele até começou a mostrar marcadores de localização para capturas de tela de nossa área de trabalho com vários aplicativos abertos.

Não sabemos como esses modelos são integrados ao aplicativo, mas alguns desses recursos podem ser executados localmente. Obviamente, esses modelos de PC requerem mais espaço de armazenamento e uma CPU poderosa com 16 GB de memória ou mais.

Vale a pena baixar um modelo de 5 GB para converter prompts de texto em imagens ou esperar 30 segundos para implementar essa funcionalidade em um aplicativo web? Claramente, a maioria desses recursos tem casos de uso e ambientes de implementação muito específicos, em vez de atrair toda a base de usuários do Windows 11.