Uma pessoa familiarizada com o assunto revelou que a OpenAI está finalizando um novo modelo com recursos avançados de segurança de rede e planeja fornecê-lo apenas a um pequeno número de clientes corporativos, semelhante ao lançamento em pequena escala de seu modelo de segurança de rede “Mythos” da Anthropic. A razão pela qual atrai a atenção é que a inteligência artificial é considerada por muitos especialistas em segurança como tendo atingido um “ponto crítico” em termos de autonomia e capacidades de hacking. As empresas de desenvolvimento de modelos estão agora cada vez mais preocupadas com os danos na vida real que as suas próprias ferramentas podem causar, tanto que não estão dispostas a “lançá-las” completamente no ambiente público.

Na terça-feira, a Anthropic anunciou que o seu novo modelo “Mythos Preview” só estará aberto a um pequeno número de empresas de tecnologia e segurança cibernética cuidadosamente selecionadas porque o modelo tem capacidades de intrusão e exploração muito avançadas, levantando preocupações sobre potenciais abusos. Naquela época, a Anthropic foi a primeira empresa de IA a adotar restrições tão estritas em sua estratégia de lançamento de novos modelos, e agora foi revelado que a OpenAI está planejando seguir um caminho semelhante.

Olhando para os detalhes, a OpenAI lançou um projeto piloto chamado "Trusted Access for Cyber" em fevereiro deste ano, após o lançamento do GPT-5.3-Codex, que possui os recursos de raciocínio de segurança de rede mais fortes até o momento. As organizações convidadas a aderir ao programa fechado terão acesso a capacidades cibernéticas ofensivas e defensivas mais elevadas ou a um modelo mais “clemente” para acelerar os esforços de segurança defensiva legal, de acordo com um blog da empresa. A OpenAI também prometeu na época que forneceria um total de US$ 10 milhões em suporte de cota de API aos participantes do projeto para experimentos e implantação relacionados.

O contexto mais amplo é que, ao longo do ano passado, vários antigos funcionários governamentais e líderes de segurança de topo têm soado o alarme, alertando que, se caírem em mãos erradas, alguns modelos de IA poderão um dia ser capazes de perturbar os sistemas de água, as redes de energia e até mesmo as infraestruturas financeiras sem intervenção humana. Estas capacidades, anteriormente consideradas como “cenários futuros”, estão agora a começar a tomar forma aos olhos dos especialistas da indústria.

No entanto, mesmo que as empresas de IA “apertem temporariamente as comportas” através de pilotos limitados e lançamentos faseados, os principais especialistas em segurança geralmente acreditam que a tendência geral é difícil de reverter. "Você não pode impedir que o modelo faça enumeração de código ou encontre brechas na antiga base de código. Essa capacidade já existe objetivamente." Rob T. Lee, diretor de IA do SANS Institute, destacou. Wendi Whitmore, diretora de inteligência de segurança da Palo Alto Networks, disse em uma mesa redonda na conferência HumanX em São Francisco que pode faltar apenas algumas semanas ou meses para que o próximo modelo com capacidades semelhantes surja e flua para um ambiente mais aberto. Adam Meyers, vice-presidente sênior de contramedidas da CrowdStrike, descreveu as capacidades demonstradas pela Mythos como “um alerta para toda a indústria”.

Na opinião de alguns profissionais de segurança, se a empresa estiver realmente preocupada com a capacidade do modelo de “escrever novos programas de ataque e exploração” em vez de apenas “ajudar as pessoas a encontrar vulnerabilidades existentes”, então seria mais “razoável” limitar o escopo de lançamento de modelos de ponta e implementar a liberação em lote. Stanislav Fort, CEO da Aisle Security Company, disse à Axios que a capacidade de gerar automaticamente uma nova cadeia de exploração de vulnerabilidades é potencialmente mais ameaçadora para o ecossistema do que simplesmente descobrir falhas, por isso precisa ser verificada lentamente em um ambiente controlado.

Alguns especialistas também apontaram que o atual modelo de grande escala é aberto em etapas, o que é, até certo ponto, muito semelhante à forma como os fornecedores tradicionais de segurança de rede divulgam informações sobre vulnerabilidades de software. Lee acredita que isso é muito semelhante ao debate sobre a “divulgação responsável de vulnerabilidades” na indústria há muitos anos: como equilibrar o tempo e o escopo entre a divulgação de riscos e o fornecimento de patches é uma questão repetidamente discutida. A diferença é que o que foi “adiado na divulgação” desta vez não é mais uma única vulnerabilidade de software, mas uma ferramenta geral inteligente que pode amplificar enormemente as capacidades de ataque e defesa.

Não está claro se a OpenAI trará este próximo modelo de segurança cibernética ao mercado de forma mais ampla em algum momento no futuro. Em contrapartida, a Anthropic deixou claro que não lançará totalmente o Mythos Preview ao público, mas se puder ser equipado com grades de segurança suficientemente fortes no futuro, não descarta a possibilidade de considerar uma gama mais ampla de aberturas para outros modelos da série Mythos. Ao mesmo tempo, equipas de investigação como Aisle também lembraram que os modelos de IA existentes amplamente disponíveis no mercado já podem encontrar um número considerável de vulnerabilidades e caminhos de exploração em casos de demonstração do Mythos. Isto significa que o que verdadeiramente constitui o “fosso” de segurança são provavelmente mais os sistemas e processos construídos em torno do modelo, do que o “volume” e a “geração” do próprio modelo.