OpenAI lança kit de ferramentas de segurança juvenil de código aberto para ajudar os desenvolvedores a criar aplicativos de IA mais seguros

A OpenAI anunciou na terça-feira o lançamento de um kit de ferramentas de política de segurança voltado para jovens para desenvolvedores, com o objetivo de ajudar aplicativos de terceiros a incorporar regras de segurança para proteger menores desde o início de seu design. O kit de ferramentas está disponível como um conjunto de prompts de "Política de Segurança Juvenil" que podem ser chamados diretamente e pode ser usado com o modelo de segurança ponderada de código aberto da OpenAI, gpt-oss-safeguard.

OpenAI disse que os desenvolvedores não precisam começar do zero para projetar mecanismos de segurança para menores e podem usar diretamente esse conjunto de palavras de alerta para “reforçar” aplicativos de IA existentes ou recém-desenvolvidos. Estas políticas centram-se em áreas sensíveis, como violência gráfica e conteúdo pornográfico, imagem e comportamento corporal prejudiciais, atividades e desafios de risco, dramatizações românticas ou violentas e bens e serviços com restrição de idade. A empresa enfatiza que essas políticas de segurança são fornecidas na forma de palavras imediatas, para que possam ser facilmente adaptadas a outros modelos além do gpt-oss-safeguard, mas espera-se que o efeito seja melhor quando usadas dentro do próprio ecossistema da OpenAI.

No desenvolvimento da política, a OpenAI trabalha com terceiros no espaço de segurança de jovens e de conteúdo, incluindo o órgão de vigilância de segurança de IA Common Sense Media e Everyone.ai. Robbie Torney, chefe de IA e avaliação digital da Common Sense Media, disse em um comunicado que essas políticas imediatas baseadas em palavras ajudam a estabelecer um resultado final de segurança significativo para todo o ecossistema, e o método de liberação de código aberto também permite que todas as partes se ajustem e melhorem continuamente ao longo do tempo.

A OpenAI aponta em um blog complementar que mesmo equipes experientes muitas vezes lutam na prática para traduzir metas abstratas de segurança em regras concretas e aplicáveis. A empresa acredita que este desvio pode levar a lacunas nas medidas de proteção, padrões de implementação inconsistentes e até bloqueio excessivo, pelo que políticas claras e bem delimitadas são uma base fundamental para a construção de um sistema de segurança eficaz.

A OpenAI também reconhece que este conjunto de políticas não pode resolver fundamentalmente todos os desafios complexos da segurança da IA. Mas a empresa enfatizou que a nova ferramenta é uma expansão adicional das medidas de segurança existentes, incluindo controles parentais em nível de produto, previsão de idade e outras funções. Em 2025, a OpenAI atualizou a especificação de comportamento (Model Spec) de seu grande modelo de linguagem para esclarecer como o modelo deve responder e limitar ao enfrentar usuários menores de 18 anos.

Ainda assim, a OpenAI enfrenta questões sobre o seu próprio histórico de segurança. A empresa enfrenta atualmente diversas ações judiciais movidas por familiares de usuários que cometeram suicídio após uso extremo do ChatGPT. O processo alega que alguns dos relacionamentos perigosos formados depois que os usuários contornaram a segurança do chatbot e que nenhuma defesa do modelo atual é verdadeiramente “impenetrável”. Neste contexto, a indústria geralmente acredita que, embora esta política de segurança juvenil de código aberto não seja a solução definitiva, ela fornece um caminho de conformidade relativamente fácil de usar para desenvolvedores independentes e pequenas equipes, e é considerada um novo passo em frente na promoção de práticas de segurança de IA para menores.

saber mais:

https://github.com/openai/teen-safety-policy-pack