A Anthropic lança oficialmente Claude Fable 5 e Claude Mythos 5. O primeiro está aberto a usuários comuns, enquanto o último continua restrito a “parceiros de segurança confiáveis”. Pode-se dizer que a nomenclatura do novo modelo está de acordo com o estilo consistente de Claude.

Do Haiku (haiku) ao Sonnet (soneto) ao Opus (obra-prima artística), a Anthropic vem sobrepondo modelos com conceitos literários e artísticos. Por Mythos, o nome se expandiu de obras literárias para a própria “mitologia”.

Fábula vem do latim fabula, que significa “algo que se conta”, e tem a mesma origem do mito grego. Quando traduzido literalmente, é geralmente chamado de “fábula”. O nome é exatamente como o posicionamento do novo modelo, um modelo de “nível Mythos”, um “mito aberto”.

De acordo com a descrição da Anthropic, Fable 5 e Mythos 5 compartilham o mesmo modelo subjacente, mas são embalados em um shell seguro mais adequado para distribuição pública. Em termos de capacidades do modelo oficial, os dois se colocam na mesma posição.


Mas pontuações são pontuações, e se Fable e Mythos tivessem o mesmo desempenho, acho que não haveria necessidade de separá-los em dois nomes.

O "mito" reescrito

Os mitos foram reescritos, compactados e advertidos e tornaram-se fábulas.

Segundo a documentação oficial, Fable 5 é uma versão pública. Está aberto a usuários e desenvolvedores comuns, mas em áreas de alto risco, como segurança de rede, biologia, química e destilação de modelos, classificadores de segurança adicionais estarão envolvidos. Assim que o sistema determinar que a solicitação pode envolver essas instruções sensíveis, a resposta não será continuada pela Fable 5, mas retornará automaticamente para Claude Opus 4.8.

Mythos 5 é baseado no mesmo modelo subjacente, mas levanta as barreiras de proteção do Fable 5 em algumas áreas. A Anthropic disse que os parceiros de segurança de rede do Projeto Glasswing podem usar a “versão completa” do Mythos 5; no futuro, alguns pesquisadores de ciências biológicas também poderão usar versões que removam restrições biológicas e químicas por meio do Programa de Acesso Confiável.

Não mencionaremos os Mythos não utilizados por enquanto, vamos examinar algumas coisas práticas primeiro.

O primeiro é o preço. Em uma palavra, caro.

O preço do Fable 5 é de US$ 10/milhão de tokens para entrada e US$ 50/milhão de tokens para saída. Os desenvolvedores agora podem chamar claude-fable-5 (nome do modelo) por meio da API Claude.

Este preço é exatamente o dobro do Opus 4.8 e é igual ao modo rápido do Opus 4.8. A Anthropic obviamente o colocou em uma faixa de preço mais alta do que o Opus.

No entanto, a Anthropic disse que este preço é menos da metade do Claude Mythos Preview anterior - mas como o Mythos Preview não é um modelo de API público, o oficial não forneceu um preço padrão para o público, e esta frase não pode ser verificada.

Os assinantes também precisam observar que Fable 5 pode não ser incluído diretamente no pacote básico de assinatura por um longo tempo.

A Anthropic mencionou em sua descrição oficial que após 23 de junho, mesmo que os usuários tenham assinado Claude, o Fable 5 poderá ser fornecido em volume com base na capacidade de computação e não poderá ser incluído diretamente no serviço básico de assinatura.

Esta empresa está cada vez mais mesquinha, mas pelo menos ainda tem um período experimental de meio mês. O responsável também deixou alguma margem de manobra: se os recursos de poder computacional forem suficientes após 23 de junho, a Anthropic tentará continuar a incluir o Fable 5 no Pro, Max e outros serviços de assinatura.


O preço elevado não é difícil de compreender por si só, mas é melhor garantir que as suas capacidades são dignas do seu preço.

A julgar pelas pontuações contínuas, Fable 5/Mythos 5 é basicamente o mais forte da Anthropic atualmente.

No entanto, há uma nota na tabela oficial de que as pontuações de Claude Fable 5 e Claude Mythos 5 estão geralmente separadas por apenas 1-3 pontos percentuais (exceto para segurança de rede e testes bio-relacionados com asteriscos), portanto a tabela mostra a pontuação mais alta dos dois. É difícil não reclamar disso.


Anthropic concentra Fable 5 em várias direções: engenharia de software, trabalho de conhecimento, visão, memória de contexto longo e pesquisa em ciências biológicas.

A engenharia de software é um dos cenários mais proeminentes. De acordo com a tabela, Fable/Mythos 5 atingiu 80,3% no SWE-Bench Pro, o que é significativamente superior aos 69,2% do Opus 4.8; no FrontierCode Diamond, mais difícil, obteve 29,3%, enquanto o Opus 4.8 teve apenas 13,4% e o GPT-5.5 teve apenas 5,7%.



Para trabalhos de conhecimento e tarefas visuais, a Anthropic fornece dois tipos de evidências.

Um tipo é o benchmark padronizado. A tabela oficial mostra que Fable/Mythos 5 obteve pontuação de 1932 no GDPval-AA, superior ao Opus 4.8, GPT-5.5 e Gemini 3.1 Pro; na tarefa de documento GDP.pdf com compreensão visual, atingiu 29,8%, superando também outros modelos importantes.

Outra categoria são os testes iniciais do cliente. A Anthropic disse que o Fable 5 alcançou a pontuação mais alta no benchmark de raciocínio financeiro avançado da Hebbia, com suas vantagens focadas no raciocínio de documentos, compreensão de gráficos e tabelas e resolução de problemas; A IMC também informou que passou quase totalmente na avaliação de análise de transação.

Para demonstrar as capacidades visuais do Fable 5, a Anthropic deu um exemplo: Anteriormente, o modelo Claude exigia ferramentas auxiliares complexas para jogar "Pokémon: Fire Red", mas o Fable 5 pode completar o nível apenas com entrada visual.


Em termos de tarefas de longo prazo e capacidades de memória, a Anthropic disse que o Fable 5 pode manter o foco em tarefas de longo prazo com milhões de tokens e usar suas próprias notas para melhorar a produção.

Em jogos como "Slay the Spire", que exigem tomada de decisão contínua e estratégia de longo prazo, se Fable 5 estiver conectado a uma memória de arquivo persistente para poder registrar escolhas e experiências anteriores, seu desempenho será significativamente melhorado. A melhoria é três vezes maior que a do Opus 4.8, e o número de vezes que você pode atingir o nível final também aumenta três vezes.

Aliás, Fable também é o nome de um clássico jogo de RPG, traduzido para o chinês como “Fable” – talvez um dia possamos ver Fable jogando “Fable”.

Além disso, em termos de capacidades de segurança de rede, o Fable/Mythos 5 atingiu 78,0% no ExploitBench Cap%, excedendo os 69,0% do Claude Mythos Preview e quase o dobro do Opus 4.8.

A pontuação do Mythos 5 deve ser usada aqui, porque o Fable 5 retornará ao Opus 4.8 em solicitações de alto risco.

Modelos fortes devem ser dispostos em camadas

Desta vez, a Anthropic colocou a exibição visual das capacidades do modelo em uma página deslizante semelhante a um “portfólio”, e apenas deu um pequeno parágrafo de comentários para cada demonstração.


Por exemplo, Fable 5 escreveu uma simulação do sistema solar que deduziu o movimento orbital planetário dos primeiros princípios da física e o usou para prever eclipses solares.


Por outro exemplo, ele pode reproduzir “Factory” de forma independente. Este é um jogo de automação de fábrica que os engenheiros adoram. Os jogadores precisam coletar recursos, planejar linhas de produção e construir sistemas logísticos e energéticos.

A Anthropic usou este exemplo para ilustrar que Fable 5 pode formular estratégias em um ambiente aberto e continuar a promover a construção de um sistema complexo.


Em outra demonstração, o Fable 5 primeiro criou um editor CAD baseado em navegador e, em seguida, usou essa ferramenta CAD desenvolvida por ele mesmo para projetar um modelo completo que pode ser impresso em 3D. Este editor também possui copiloto de IA integrado para auxiliar na modelagem.

O foco desta demonstração é que o Fable 5 completa um ciclo fechado: primeiro crie a ferramenta, depois use a ferramenta e, finalmente, conclua uma tarefa de design físico.


A última demo, Anthropic, exibiu uma simulação fluida escrita por Fable 5, com ritmo de movimento sincronizado com um remix de música clássica EDM. O responsável também mencionou especificamente que a música também é gerada pelo Fable 5 através de código.


Esses exemplos parecem sofisticados, mas a ideia é a mesma: Fable 5 é ótimo para misturar código, visão, física, design e planejamento de longo prazo em tarefas.

Se esta parte mostra o que o Fable 5 pode fazer nas mãos dos desenvolvedores, a parte seguinte fala sobre o que o Mythos 5 pode fazer nas mãos dos pesquisadores – e por que a Anthropic quer separar Fable e Mythos.

A Anthropic disse que, em avaliações feitas por especialistas internos em design de proteínas, o Mythos 5 acelerou alguns aspectos do processo de design de medicamentos em aproximadamente 10 vezes. Num caso, o Mythos 5 conectou-se a ferramentas de design de proteínas e bioinformática, sem ajuda humana, para igualar ou mesmo superar operadores humanos qualificados.

Nesta tarefa, o Mythos 5 não apenas responde a perguntas, mas completa um conjunto completo de fluxos de trabalho científicos: seleção de locais de ligação, seleção e execução de ferramentas de design de proteínas e recuperação após falha. As autoridades disseram que dos 14 alvos proteicos neste estudo, 9 produziram moléculas candidatas fortes e estão atualmente em investigação adicional.


A Anthropic também mencionou que o Mythos 5 pode propor de forma constante hipóteses novas e atraentes de biologia molecular. Numa comparação de teste cego com modelos de nível Opus, os cientistas internos preferiram as hipóteses propostas pela Mythos cerca de 80% das vezes, algumas das quais foram avaliadas experimentalmente.

Enquanto isso, uma das hipóteses do Mythos 5 sobre um novo mecanismo para a proteína E. coli foi confirmada em um estudo realizado por outro laboratório que estuda independentemente o mesmo problema.

Até fez um estudo genômico.

A Anthropic disse que o Mythos 5 concluiu um novo estudo genômico quase de forma autônoma em pouco mais de uma semana. Organizou dados unicelulares de milhões de células de 138 espécies animais e projetou e treinou um modelo personalizado de aprendizado de máquina para identificar células que desempenham a mesma função em espécies diferentes.

O que é ainda mais exagerado é que a Anthropic afirma que o desempenho do modelo treinado pelo Mythos 5 excede o de um modelo publicado recentemente na Science, embora a sua escala seja apenas um por cento deste último. A Anthropic disse que planeja publicar esses resultados nos próximos meses.

Claro, esta parte ainda precisa aguardar o artigo e a revisão externa. Mas se você olhar apenas as informações oficiais fornecidas pela Anthropic, as capacidades do Mythos 5 em ciências da vida são próximas às de um agente de pesquisa científica: ele pode ler perguntas, usar ferramentas, processar dados, treinar modelos, propor hipóteses e avançar uma pesquisa até o ponto onde ela possa ser publicada.

Uma vez que um modelo possa realmente avançar nas tarefas de design de medicamentos, vetores virais, design de proteínas e pesquisa genômica, ele naturalmente terá usos duplos.

Pode-se considerar que a parte das ciências da vida não é uma demonstração funcional comum do Fable 5, mas uma demonstração do limite superior das capacidades do Mythos 5.

Mas é mostrado para ilustrar que o modelo subjacente nas mãos da Antrópico é tão poderoso que deve ser distribuído através de acesso confiável.

Curiosamente, o lançamento do modelo no passado era mais como um produto técnico: parâmetros, pontuações de execução, preço, comprimento do contexto, nome da API. Forte é forte, liberação é liberação.

Mas aqui no Mythos as coisas começam a ficar complicadas. O mesmo modelo subjacente está dividido em duas versões. Usuários comuns obtêm o Fable 5, enquanto pesquisadores de segurança e alguns pesquisadores de ciências biológicas obtêm o Mythos 5; o primeiro é instalado em guarda-corpos mais rígidos e o segundo requer acesso confiável.

As capacidades do modelo não são mais diferenciadas apenas por alto e baixo, mas também por autoridade, cenários e responsabilidades.

Num certo sentido, pode ser visto como um sinal de que a comercialização de modelos de vanguarda entrou numa nova fase – quanto mais forte for o modelo, menor será a probabilidade de ser lançado directamente a todos. Eles serão divididos em diferentes versões, colocados em diferentes limites de segurança e depois fornecidos a diferentes tipos de usuários.

A Anthropic fez isso primeiro porque seu modelo era “forte demais para ser totalmente divulgado”. No futuro, outras empresas que queiram contar histórias e provar que os seus modelos são fortes também poderão seguir esta abordagem.