Em 1º de julho, horário de Pequim, o principal fabricante americano de modelos Anthropic lançou uma nova geração do modelo principal de gama média Claude Sonnet 5. Ao mesmo tempo, o funcionário confirmou que recebeu uma notificação do Departamento de Comércio dos EUA para suspender oficialmente as restrições aos principais modelos da empresa, Claude Fable 5 e Mythos 5, e restaurará totalmente o acesso global a partir de amanhã.

No entanto, a Anthropic não respondeu diretamente à questão levantada pelos internautas se o novo modelo é aberto a todos ou apenas a usuários/cidadãos autenticados. Anteriormente, as autoridades revelaram que a Anthropic tem trabalhado em estreita colaboração com o governo dos EUA e implantou o Mythos5 em algumas operações dos EUA e organizações de infraestrutura crítica de defesa em 27 de junho.

O lançamento do Sonnet 5 marca a conclusão do sistema modelo de quinta geração da Anthropic. Na série de produtos, o Sonnet 5 está entre o leve Haiku 5 e o carro-chefe de última geração Opus 4.8 (e Fable 5). Os dados de teste mostram que, em termos de capacidades principais de programação do Agente, o Sonnet 5 registrou uma pontuação de 63,2%, 5,1 pontos percentuais acima do Sonnet 4.6 da geração anterior (58,1%), e a diferença em relação ao carro-chefe Opus 4.8 (69,2%) diminuiu para menos de 6%.


No layout oficial de posicionamento de tecnologia, o longboard Sonnet 5 concentra-se na geração de código complexo, análise aprofundada de documentos longos, automação em várias etapas e forte implementação de "controle de computador" (incluindo controle independente de navegadores, terminais e GUIs). O novo modelo tem a capacidade de formular planos de longo prazo de forma independente e coordenar chamadas entre ferramentas. Ele pode ser executado de forma independente por um longo tempo, sem intervenção manual, atendendo às necessidades da atual comunidade de desenvolvedores para a execução de tarefas de longo prazo.

Os recursos de agente e aplicativo de destino também são o foco da principal competição da Anthropic com OpenAI. Para competir com os dados comerciais e o limite de receita da OpenAI antes de se tornar público, a Anthropic adotou um novo segmentador de palavras (Tokenizer) no Sonnet 5, que melhora a precisão subjacente ao mesmo tempo que faz com que a mesma entrada de texto consuma 1,0 a 1,35 vezes mais tokens do que antes.

Para se proteger contra a recuperação no custo total do usuário (TCO) causada pela reconstrução do tokenizer, a Anthropic lançou uma promoção de preços em fases: durante o período de promoção antes de 31 de agosto, o preço básico por milhão de Tokens da API é reduzido para US$ 2 para entrada e US$ 10 para saída; mas a partir de 1º de setembro voltará ao faturamento padrão (US$ 3 para entrada e US$ 15 para saída). O grupo de desenvolvedores acredita que devido à expansão da base real de consumo de tokens, após o período de promoção, a conta real de chamadas será inevitavelmente superior à versão histórica.

Por trás dessa decisão empresarial está a pressão financeira pré-IPO enfrentada pela Antrópica. Quando Wall Street avalia laboratórios de IA de ponta, ela não olha mais apenas para o número de usuários (MAU), mas se concentra na auditoria do ARPU (receita média por usuário) e na margem de lucro bruto. Comparado com o carro-chefe Opus, que é caro e tem volume de chamadas limitado, o Haiku de baixo custo tem lucros escassos. O sistema Sonnet de médio porte pode lidar com a maioria dos serviços complexos, aumentando assim a taxa de fluxo do negócio principal da empresa.

É importante notar que durante o período em que Fable 5 e Mythos 5 foram anteriormente restringidos, o período de janela no mercado global de IA estava a acelerar em direção aos fabricantes chineses. Durante este período, o GLM-5.2 lançado pela Zhipu, uma grande empresa modelo chinesa, desencadeou discussões generalizadas em comunidades de código aberto e desenvolvedores no exterior devido ao seu raciocínio econômico. Os desenvolvedores estrangeiros estão mostrando uma tendência de confiar em pilhas de tecnologia diversificadas, e os grandes modelos chineses têm mostrado maior flexibilidade de substituição na onda global de evolução dos Agentes.