OpenAI lança modelo de programação GPT‑5.1-Codex-Max projetado para tarefas de longa duração

A OpenAI lançou hoje o GPT‑5.1-Codex-Max, um modelo de codificação Agentic de nova geração projetado para tarefas de longa execução. Em comparação com os modelos anteriores, o GPT‑5.1-Codex-Max usa tecnologia de “compactação”, que pode funcionar em várias janelas de contexto e pode até processar milhões de tokens de maneira confiável em uma única tarefa. OpenAI disse que o modelo não apenas melhora o desempenho, mas também alcança uma utilização de token mais rápida e eficiente.

Entende-se que o processo de treinamento GPT-5.1-Codex-Max cobre tarefas de engenharia de software do mundo real, como criação de PR, revisão de código, desenvolvimento front-end e perguntas e respostas, etc., e superou modelos anteriores em muitas avaliações de programação de ponta. Por exemplo, o modelo alcançou uma pontuação de 77,9% no SWE-Bench Verified (500 amostras), 79,9% na avaliação SWE-Lancer IC SWE e 58,1% na avaliação TerminalBench 2.0, todos superiores ao desempenho anterior do GPT-5.1-Codex.

Além de oferecer suporte a plataformas Unix, o GPT‑5.1-Codex-Max é treinado especificamente para ambientes Windows. Em reconstruções complexas e loops de agentes de longa duração, a maioria dos modelos de codificação no mercado são limitados pela janela de contexto e são difíceis de trabalhar continuamente. O GPT‑5.1-Codex-Max, por outro lado, pode ser executado de forma autônoma por horas ou até dezenas de horas, compactando automaticamente o conteúdo da sessão quando ele se aproxima do limite da janela. De acordo com dados de testes internos da OpenAI, o modelo pode funcionar continuamente por mais de 24 horas.

Além disso, graças aos recursos de raciocínio aprimorados, o GPT‑5.1-Codex-Max usa 30% menos tokens de pensamento do que o GPT-5.1-Codex ao concluir a mesma tarefa no SWE-Bench Verified. Através do modo de raciocínio "Extra High (xhigh)", o modelo pode envolver-se em pensamentos mais profundos em tarefas complexas.

Atualmente, o GPT‑5.1-Codex-Max foi lançado em produtos Codex CLI, extensão IDE, nuvem e revisão de código, oferecendo suporte a usuários assinantes premium ChatGPT Plus, Pro, Business, Edu e Enterprise. Ao mesmo tempo, a OpenAI também introduzirá este modelo na API em um futuro próximo e o substituirá pelo modelo padrão no Codex.