A startup de inteligência artificial Anthropic anunciou hoje que seu popular modelo Claude Sonnet 4 LLM agora suporta até 1 milhão de tokens contextuais. Depois do Google Gemini, a Anthropic se torna o segundo maior fornecedor de modelos a entregar 1 milhão de tokens contextuais.
Anteriormente, a API Claude Sonnet 4 suportava apenas 200.000 tokens contextuais. Com essa expansão quíntupla, os desenvolvedores podem enviar toda a sua base de código de mais de 75.000 linhas de código em uma única solicitação.
O suporte estendido ao contexto está agora em testes públicos na API Anthropic e no Amazon Bedrock, com o Google Cloud Vertex AI chegando em breve. No entanto, o suporte de contexto longo está atualmente limitado a desenvolvedores de nível 4 e requer limites de taxa personalizados. A Anthropic observa que esse recurso estará disponível para mais desenvolvedores nas próximas semanas.
Como janelas de tokens maiores exigem maior poder de computação, a Anthropic introduziu preços especiais. Para prompts abaixo de 200.000 tokens, o Sonnet 4 custa US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída. Para prompts com mais de 200.000 tokens, o custo é de US$ 6 por milhão de tokens de entrada e US$ 22,50 por milhão de tokens de saída.
Os desenvolvedores podem reduzir custos usando cache rápido e processamento em lote. Por exemplo, o processamento em lote pode oferecer um desconto de 50% no preço da janela de contexto de 1 milhão.
Em uma sessão recente do Reddit AMA, os líderes da OpenAI discutiram o suporte a longas janelas de contexto para seus modelos. O CEO da OpenAI, Sam Altman, disse que a OpenAI não tem visto uma forte demanda dos usuários por longos períodos de contexto, mas se houver interesse suficiente, eles estão dispostos a apoiá-lo. Com poder computacional limitado, eles querem se concentrar em outras prioridades.
Michelle Pokrass, da equipe OpenAI, escreveu que gostariam de fornecer um contexto mais longo no GPT-5, até 1 milhão de tokens, especialmente para casos de uso de API, mas não o fizeram devido à alta demanda de GPU.
O suporte de contexto 1M da Anthropic a coloca em competição direta com o Google Gemini por recursos de contexto longo, pressionando a OpenAI a repensar seu roteiro.
