A janela de contexto Claude 1M está totalmente aberta, os preços são unificados e as cotas de mídia aumentaram bastante

A Anthropic anunciou que a janela de contexto de 1 milhão de tokens para seus modelos principais Claude Opus 4.6 e Sonnet 4.6 está oficialmente totalmente aberta e cobrada a preços padrão na plataforma Claude, sem nenhum prêmio adicional de contexto longo.Sob o novo sistema de preços, o Opus 4.6 mantém uma entrada de US$ 5 e uma produção de US$ 25 por milhão de tokens, enquanto o Sonnet 4.6 mantém uma entrada de US$ 3 e uma produção de US$ 15 por milhão de tokens. Mesmo que seja uma solicitação de 900.000 tokens, sua taxa unitária de token é exatamente a mesma que uma solicitação de 9.000 tokens.

Nesta abertura abrangente, a Anthropic atualizou sistematicamente suas capacidades de longo contexto e experiência do usuário. Em primeiro lugar, todas as solicitações que suportam janelas de 1 milhão desfrutam do mesmo limite de taxa que as solicitações normais. Os desenvolvedores não precisam implementar estratégias adicionais de divisão ou downgrade de tráfego em cenários de alta simultaneidade ou conversas longas. Em segundo lugar, o funcionário cancelou o cabeçalho da tag beta anteriormente exigido ao acessar contextos com mais de 200 mil tokens. Agora, solicitações com mais de 200 mil tokens podem ser chamadas diretamente. Os aplicativos existentes que ainda enviam cabeçalhos beta podem fazer uma transição tranquila sem alterar seu código.

As capacidades de processamento de mídia também são um dos focos desta atualização. O número de imagens ou páginas PDF que Claude pode receber em uma única solicitação aumentou de 100 para 600, cobrindo cenários multimodais complexos, como revisão de código, documentos legais, artigos de pesquisa científica, registros de operação e manutenção, etc., e foi lançado simultaneamente na plataforma Claude, Microsoft Azure Foundry, Google Cloud Vertex AI e outros canais. A Anthropic disse que esse ajuste visa permitir que os desenvolvedores contextualizem centenas de páginas de material de uma só vez, sem a necessidade de segmentação e compactação frequentes, reduzindo assim a complexidade da engenharia e a perda de informações.

Nos cenários corporativos e profissionais, o impacto do contexto 1M é particularmente proeminente. As autoridades enfatizam que o contexto longo só é significativo se puder ser "lembrado e bem usado", portanto, otimizações especiais foram feitas no Opus 4.6 e no Sonnet 4.6 para memória de longo alcance e capacidades de raciocínio. Em benchmarks de terceiros, o Opus 4.6 alcançou uma pontuação de 78,3% no MRCR v2, e o Sonnet 4.6 obteve uma pontuação de 68,4% no GraphWalks BFS (tokens de 1 milhão), liderando entre os modelos de ponta com o mesmo comprimento de contexto.

Isso significa que os desenvolvedores podem carregar um repositório de código completo, dezenas de milhares de páginas de texto de contrato ou rastreamentos de chamadas de ferramentas, registros de observação e processos de raciocínio intermediários de agentes de longa execução em uma única sessão, sem ter que depender de "deslizamento de janela" complexo, "múltiplas rodadas de resumo" ou limpeza frequente do contexto histórico. Vários parceiros apontaram em citações que o contexto 1M permite que o agente funcione por horas sem perder detalhes, o que não apenas reduz a perda de informações importantes causada pela compactação, mas também reduz o custo de suplementos e explicações repetidas em múltiplas rodadas de depuração, revisões de código e análise de operação e manutenção em larga escala.

No campo do desenvolvimento de código, a janela 1M do Opus 4.6 foi totalmente integrada à linha de produtos Claude Code e está aberta para usuários Max, Team e Enterprise por padrão, sem configuração adicional. Os desenvolvedores relataram que depois de expandir o contexto de 200.000 para 500.000 ou até 1 milhão de tokens, o agente foi capaz de concluir tarefas com menor consumo total de tokens ao lidar com grandes alterações de código e dependências entre arquivos, reduzindo as rodadas extras e solicitações repetidas causadas pela divisão do contexto.

As equipes de operações e segurança também são vistas como beneficiárias diretas de capacidades de longo contexto. Diante de enormes sistemas de produção e eventos de alarme complexos, os engenheiros podem reter todas as entidades, sinais e hipóteses de solução de problemas em uma sessão, mantendo um link completo de informações desde o alarme inicial até a mitigação do problema. Os parceiros dizem que com o contexto 1M, eles não precisam mais “comprimir memória” frequentemente ao processar grandes logs, monitorar dados e status de sistemas de múltiplas fontes, reduzindo significativamente o risco de perder anomalias sutis.

Para escritórios de advocacia, instituições de pesquisa científica e empresas com uso intensivo de dados, longas janelas de contexto proporcionam um novo paradigma de processamento de conhecimento. O pessoal jurídico pode apresentar múltiplas versões de centenas de páginas de contratos de uma só vez para revisar completamente as alterações em diversas rodadas de negociações; as equipes de pesquisa científica podem incorporar simultaneamente centenas de artigos, fórmulas matemáticas e códigos de simulação em um processo de raciocínio para construir uma análise abrangente de documentos e modelos. Algumas instituições colaboradoras afirmam que esta capacidade de “integração única” está a acelerar significativamente o ritmo iterativo da investigação básica e aplicada.

Em termos de canais de acesso, o contexto 1M foi habilitado na plataforma nativa de Claude e fornecido por meio de serviços em nuvem como Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry, e está aberto a empresas e desenvolvedores simultaneamente. A Anthropic fornece documentação técnica e páginas de preços correspondentes para facilitar a avaliação da equipe sobre custos de integração e estratégias de implantação, e enfatiza que todas as solicitações atuais que suportam a janela 1M continuarão a usar os padrões de faturamento existentes.

A Anthropic disse que à medida que o contexto 1M entra no estágio totalmente disponível, a equipe continuará a iterar na estabilidade do raciocínio de longo alcance, na compreensão intermodal e nas capacidades de integração de nível empresarial, na esperança de ajudar os usuários a mudar de "fazer concessões de engenharia em torno do comprimento da entrada" para "projetar agentes em torno do próprio problema de negócios". Os desenvolvedores e usuários corporativos podem ativar imediatamente esse recurso por meio da plataforma Claude e dos principais parceiros de nuvem para atualizar facilmente os aplicativos existentes para a era do longo contexto.