Pentágono planeja permitir que empresas de IA treinem modelos em dados classificados

De acordo com o MIT Technology Review, o Departamento de Defesa dos EUA está a planear uma grande mudança: construir um ambiente de treino altamente confidencial para empresas de inteligência artificial generativa, para que possam treinar versões militares de grandes modelos com base em dados confidenciais de inteligência militar. Isto significa que os modelos que originalmente apenas “liam” e “respondiam perguntas” num ambiente confidencial poderão utilizar diretamente dados confidenciais como material de formação no futuro, “gravando” assim informações sensíveis no próprio modelo.

Alguns modelos generativos de IA, como o Claude da Anthropic, já estão a ser implantados em ambientes classificados para responder a perguntas e ajudar na análise, inclusive sobre alvos iranianos. No entanto, estes modelos atualmente processam apenas informações confidenciais com base nas capacidades existentes e não reutilizarão os dados para treinar e atualizar os próprios modelos. Se for permitido treinar em dados confidenciais, espera-se que o modelo seja mais preciso e eficiente na execução de tarefas militares específicas, mas também introduzirá riscos de segurança sem precedentes.

Um oficial de defesa não identificado dos EUA disse que o treinamento do modelo personalizado militar em dados confidenciais deverá melhorar significativamente seu desempenho e confiabilidade em missões específicas. O plano surge no meio da crescente procura de modelos de IA mais poderosos nas forças armadas dos EUA: o Pentágono chegou a acordos com a OpenAI e a xAI de Musk para executar os seus modelos num ambiente classificado e está a prosseguir uma nova estratégia de inteligência artificial que visa transformar as forças armadas dos EUA numa "força de combate com IA em primeiro lugar" em resposta à escalada do conflito com o Irão. Até o momento desta publicação, o Pentágono não comentou oficialmente este plano de treinamento.

Segundo duas pessoas familiarizadas com os modos de operação relevantes, o treinamento acima será realizado em um data center certificado para projetos classificados, onde uma determinada versão do modelo de IA será emparelhada com dados classificados no mesmo ambiente seguro. De acordo com o oficial de defesa, embora a propriedade dos dados permaneça com o Departamento de Defesa dos EUA, em casos raros, os funcionários da empresa de IA também podem ter permissão para acessar os dados confidenciais se o pessoal relevante tiver a autorização de segurança apropriada. Antes de realmente abordar dados confidenciais, o Pentágono planeia primeiro testá-los em dados não confidenciais, tais como imagens de satélite comerciais, para avaliar as melhorias reais na precisão e eficácia do modelo treinado.

Os militares dos EUA há muito que utilizam uma geração mais antiga de modelos de visão computacional para realizar o reconhecimento de objetos em imagens e vídeos recolhidos por drones e aeronaves de reconhecimento, e encomendaram empresas através de contratos governamentais para treinar algoritmos em tais dados. Nos últimos anos, modelos dedicados de grandes idiomas e versões de chatbot para cenários governamentais também apareceram um após o outro, como o Claude Gov lançado pela Anthropic, que enfatiza capacidades multilíngues e implantação em um ambiente seguro. No entanto, esta declaração dos responsáveis da defesa é a primeira vez que foi claramente revelado que empresas como a OpenAI e a xAI, que desenvolvem modelos de linguagem em grande escala, podem treinar diretamente modelos personalizados pelo governo em dados confidenciais.

Aalok Mehta, ex-chefe de política de IA do Google e da OpenAI e agora diretor do Centro de IA Wadhwani do Centro de Estudos Estratégicos e Internacionais (CSIS), destacou que, em comparação com apenas “ler e responder” em um ambiente confidencial, usar verdadeiramente dados confidenciais para treinar modelos trará novos riscos. Ele acredita que o maior problema é que as informações confidenciais absorvidas pelo treinamento do modelo podem “ressurgir” quando forem consultadas ou chamadas por diferentes usuários no futuro. Isto é particularmente perigoso quando se partilha um conjunto de modelos entre vários serviços ou serviços com diferentes níveis de segurança e diferentes necessidades de inteligência.

Por exemplo, Mehta disse que se um modelo tivesse acesso a informações humanas altamente sensíveis, como a identidade de um agente secreto, essa informação poderia ser acidentalmente “vazada” para outro ramo das forças armadas quando o modelo fosse usado por outro ramo das forças armadas que não tivesse acesso. Isto não só representaria um risco de vida ou morte para as fontes de inteligência e para o pessoal da linha da frente, como também seria tecnicamente difícil de prevenir de forma absoluta, especialmente quando o mesmo modelo é partilhado por múltiplas unidades. Em contraste, ele acredita que é relativamente mais fácil “bloquear” informações confidenciais dentro das forças armadas e evitar que elas retornem à Internet aberta ou às empresas de IA.

Actualmente, o governo dos EUA estabeleceu algumas infra-estruturas relevantes: por exemplo, a empresa de segurança Palantir recebeu vários contratos de grande escala para construir um sistema de segurança para o governo que possa responder a perguntas e respostas sobre tópicos confidenciais sem repassar a informação às empresas de IA. Nesses sistemas, as autoridades podem questionar modelos sobre conteúdos classificados, enquanto os dados ficam restritos a um ambiente controlado. No entanto, aplicar a mesma arquitetura de segurança à formação, e não apenas à inferência e à resposta a perguntas, continua a ser um novo desafio técnico e de gestão.

Em Janeiro deste ano, o Secretário da Defesa Pete Hegseth emitiu um memorando apelando à aceleração da introdução de mais capacidades de IA em todo o sistema de defesa, promovendo o layout de corrida do Pentágono neste campo. A IA generativa tem sido usada em combates reais, como classificar alvos potenciais e dar sugestões de ataques prioritários. Também tem sido utilizado em trabalhos administrativos, como redação de contratos e organização de relatórios. Do ponto de vista do sector da defesa, muitas tarefas originalmente executadas por analistas humanos poderão depender de modelos de IA mais fortes no futuro, mas isto também significa que grandes quantidades de dados confidenciais devem ser abertas aos modelos.

Mehta disse que os militares podem querer que a IA aprenda alguns julgamentos sutis que dependem fortemente da experiência, como identificar pistas extremamente sutis em imagens, como um analista sênior, ou fazer conexões complexas entre inteligência recém-adquirida e informações históricas. Para este fim, os vastos e multilingues dados de texto, áudio, imagem e vídeo das agências de inteligência podem tornar-se fontes de material de formação. No entanto, ele também enfatizou que é difícil explicar ao mundo exterior quais tarefas específicas requerem treinamento em dados confidenciais, porque o Departamento de Defesa tem um forte incentivo para manter em segredo as suas capacidades específicas e não quer que outros países compreendam com precisão as fronteiras tecnológicas dos Estados Unidos neste campo.

Aos olhos do mundo exterior, o passo do Pentágono não é apenas uma resposta às necessidades da linha da frente, mas também uma aposta tecnológica de alto risco: uma vez que a inteligência confidencial esteja profundamente incorporada em grandes modelos, os militares ganharão capacidades de análise automatizada e de assistência à tomada de decisões que excedem em muito as dos sistemas tradicionais. No entanto, também terá de enfrentar novos riscos de segurança, como excesso de “memória” de modelo, fugas acidentais e limites de acesso pouco claros. Actualmente, as agências de defesa dos EUA estão a tentar encontrar um equilíbrio entre "obter vantagem militar" e "controlar os riscos de segurança" que não foi totalmente testado na prática, estabelecendo centros de dados seguros altamente isolados, controlo de acesso rigoroso e métodos de implementação de modelos personalizados e em camadas.