微软正尝试用一套全新的开源标准,帮助企业在不同系统和应用中更可控地部署功能日益强大的 AI 代理(AI agents)。 这套名为“Agent Control Specification”(代理控制规范,简称 ACS)的标准,旨在为开发者提供一种更一致、更细粒度的方式,去限定 AI 代理“能做什么、不能做什么,以及何时必须有人类介入”。

À medida que as empresas aceleram a incorporação de agentes de IA em vários aplicativos, fluxos de trabalho e produtos, um dilema importante é como garantir que o mesmo agente sempre se comporte conforme esperado e em conformidade quando executado em ambientes diferentes. Atualmente, os desenvolvedores muitas vezes constroem mecanismos de controle de maneira "emendada" por meio de palavras de prompt do sistema, adicionando verificações personalizadas aos códigos de aplicativos ou usando classificadores para interceptar a entrada e a saída do problema. Estas práticas podem funcionar a curto prazo, mas podem facilmente resultar na dispersão de estratégias de controlo por diferentes estruturas e interfaces, tornando-as difíceis de auditar e reutilizar em vários sistemas. Este ponto problemático tornou-se cada vez mais proeminente à medida que a indústria reflete sobre questões como erros na chamada de ferramentas de IA e falhas na cadeia causadas por operações inesperadas.

A Microsoft afirma que o objetivo do ACS é consolidar controles díspares em uma camada de governança unificada que permita que as equipes de desenvolvimento, conformidade e segurança restrinjam o comportamento dos agentes por meio de um único documento de política. Nestes documentos de política, as equipes podem indicar claramente quais ações são permitidas e proibidas para os agentes, sob quais circunstâncias a aprovação humana é necessária e quais evidências precisam ser registradas para análise posterior. O sistema verifica essas políticas nos principais “pontos de interceptação” onde o agente executa suas tarefas para garantir que o agente sempre opere dentro das “proteções”.

Especificamente, o ACS permite que a detecção seja implementada em vários estágios do fluxo de trabalho do agente: antes de o agente receber a entrada, antes de chamar a ferramenta, depois que a ferramenta retornar os resultados e antes de enviar uma resposta final ao usuário. As políticas podem fornecer diferentes ações nesses nós: por exemplo, permitir diretamente uma ação, bloquear a execução, dessensibilizar ou cobrir informações confidenciais ou submeter decisões a pessoal designado para aprovação. Além disso, os desenvolvedores também podem integrar classificadores de entrada e saída para classificar informações, prever possíveis resultados ou orientar os agentes sobre como responder; eles também podem introduzir modelos de linguagem em larga escala para combinar palavras de prompt específicas, deixá-los atuar como "árbitros" de políticas e adicionar lógica para verificar a invocação de ferramentas, seleção de ferramentas, precisão de entrada, uso de saída e conteúdo de resposta.

Uma das principais ideias de design do ACS é gravar essas políticas de controle em um arquivo único, independente e portátil e “empacotá-las” com o agente. Dessa forma, o mesmo conjunto de políticas de segurança e conformidade pode ser migrado com o agente entre diferentes estruturas e ambientes operacionais sem reescrever repetidamente a lógica da regra, melhorando assim a consistência e a auditabilidade entre sistemas. Para as grandes empresas que estão a promover a implementação de IA em múltiplas linhas de negócio e múltiplas pilhas de tecnologia em paralelo, espera-se que este modelo de “estratégia siga o agente” reduza os custos de governação e, ao mesmo tempo, melhore a transparência da conformidade.

Em sua forma de implementação, o ACS é fornecido na forma de SDK e foi integrado a várias estruturas de agentes convencionais e ferramentas de desenvolvimento. Segundo relatos, o ACS SDK atualmente oferece suporte a ferramentas LangChain, OpenAI Agents SDK, Anthropic Agents SDK, AutoGen, CrewAI, Semantic Kernel, Microsoft.Extensions.AI e MCP e outros ecossistemas. Através desses plug-ins, os desenvolvedores podem conectar o ACS a aplicativos de agentes existentes e incorporar arquivos de políticas em fluxos de trabalho originais sem reconstruir a arquitetura do sistema do zero.

Numa altura em que os agentes de IA estão a penetrar rapidamente nos negócios empresariais, como encontrar um equilíbrio entre "utilizável" e "fácil de usar" e "controlável" e "auditável" tornou-se uma questão realista enfrentada pelas equipas técnicas, departamentos de conformidade e equipas de segurança. A Especificação de Controle de Agente lançada pela Microsoft desta vez tenta fornecer ao setor uma infraestrutura de governança unificada de maneira padrão aberta, para que os agentes de IA possam manter a flexibilidade e, ao mesmo tempo, serem claramente restringidos e responsáveis ​​ao executarem em diferentes cenários.