O modelo Antrópico Mythos, que estava esperando há quase dois meses e dominava as redes sociais, finalmente foi lançado oficialmente hoje. Há dois meses, a Anthropic disse que seu modelo mais forte era perigoso demais para ser divulgado e só o enviou a mais de uma centena de instituições. Hoje, esses recursos estão abertos a todos: a versão lançada publicamente chama-se Claude Fable 5; o Mythos 5 verdadeiramente “irrestrito” ainda está reservado apenas para alguns parceiros.Em outras palavras, o Claude mais poderoso que você pode usar é um Mythos com limites adicionais.


O desenho deste guarda-corpo é mais digno de menção do que as próprias palavras “liberação pública”: sua forma de garantir a segurança é não rejeitá-lo.

Desta vez, a Anthropic lançou dois modelos de uma só vez: Claude Fable 5 e Claude Mythos 5. Na verdade, eles são o mesmo modelo subjacente, com apenas uma diferença - o guarda-corpo de segurança.

Fable 5 fornece um conjunto completo de classificadores de segurança para todos os usuários; O Mythos 5 remove algumas dessas restrições e as fornece apenas aos parceiros de segurança de rede no Projeto Glasswing.

Para ser franco,Fable 5 é um "Mythos com grades de proteção".

Assim como o estilo usual da Anthropic, o próprio nome do modelo também esconde algumas reflexões.

Segundo a Anthropic, Fábula vem do latim fabula, que significa “história sendo contada”, e tem a mesma origem do mito grego. Os dois nomes referem-se à mesma coisa, a única diferença é que um deles tem limite.

Puxe um pouco a linha do tempo. Em abril deste ano, a Anthropic lançou o Projeto Glasswing e, quando lançou pela primeira vez o modelo de nível Mythos (Claude Mythos Preview), ele foi concedido apenas a um pequeno grupo de instituições de segurança cibernética e de infraestrutura crítica. Na semana passada, a lista tinha-se expandido para mais de uma dúzia de países e mais de uma centena de instituições. A declaração oficial da época era que tais modelos poderiam causar sérios danos se caíssem em mãos erradas, por isso não poderiam ser tornados públicos.


Em dois meses, passou de “muito perigoso para publicar” para “disponível para todos”. O que acontece no meio é o verdadeiro protagonista deste lançamento.

O mecanismo de segurança da maioria das IAs é "negar" - você faz uma pergunta que ela não deveria responder e ela diz "Desculpe, não posso ajudá-lo".

Fable 5 adota uma abordagem diferente.Segurança não consiste em aprender a rejeitá-lo, mas em substituí-lo quando surge o perigo.

Especificamente, o Fable 5 tem um conjunto de classificadores independentes por trás dele.

Quando esse conjunto de classificadores determinar que sua solicitação se enquadra em três áreas de alto risco - ataques cibernéticos, armas bioquímicas e destilação de modelo (que se refere a "roubar" as capacidades de um modelo para treinar seu próprio modelo) - ele não deixará o Fable 5 responder, mas transferirá silenciosamente a questão para o Opus 4.8 e dirá: Acabou de ocorrer um downgrade.

O que é interessante nesse design é que ele separa “segurança” e “capacidade” em duas coisas diferentes.Você está comprando poder no nível do Mythos, mas nos três reinos mais perigosos, você está na verdade conversando com Opus.A própria afirmação da Anthropic é que a experiência de rebaixar para o Opus 4.8 é melhor do que ser diretamente rejeitada pela Fable – afinal, o próprio Opus 4.8 também é um modelo bastante forte.


De acordo com a Anthropic, mais de 95% das conversas não provocarão nenhum rebaixamento. Em outras palavras, para a maioria das pessoas, a experiência do Fable 5 que você usa é quase a mesma do Mythos 5 “completo” nas mãos do seu parceiro.

Então esse conjunto de guarda-corpos é forte? A Anthropic disse que eles fizeram mais de mil horas de testes externos da equipe vermelha e ninguém encontrou um método de “jailbreak universal” que pudesse contorná-lo (um método universal que permite ao modelo ignorar completamente todas as restrições de segurança).

Claro, eles também deixam algum espaço: provavelmente é impossível eliminar completamente os jailbreaks. O objetivo é apenas tornar qualquer vulnerabilidade “muito lenta e cara” para ser explorada em larga escala.

Mas esse mecanismo tem um preço, e a própria Anthropic disse isso primeiro: o classificador agora está ajustado com muita rigidez, o que danificará acidentalmente as solicitações normais. Um biólogo que estuda vírus ou um engenheiro de segurança que faz testes de penetração pode ser inexplicavelmente “rebaixado” no decorrer de um trabalho legítimo. O responsável admitiu que isso iria incomodar alguns utilizadores e prometeu restringi-lo gradualmente e reduzir os alarmes falsos no futuro.

Pensei nisso durante algum tempo e senti que se tratava, na verdade, de um compromisso muito inteligente, mas também bastante inútil. O inteligente é que ele não escolhe entre “atirar” e “não mandar”, mas faz um corte na habilidade; mas, infelizmente, esse corte não é preciso - para ficar online antes que algo dê errado, a Anthropic prefere matar por engano do que errar.

Somente aqueles que são perigosamente fortes merecem este conjunto de grades de proteção.

Depois de falar muito sobre segurança, você pode perguntar: quão poderosa ela é e vale a pena ser tão vulnerável ao inimigo?

Originalmente, eu queria pular o teste de benchmark - ler muitos benchmarks deixará você entorpecido, sem mencionar que o Anthropic tem uma longa lista, quase ficando em primeiro lugar em todas as categorias.

O que mais blefa vem de Stripe. De acordo com a Anthropic, Stripe usou o Fable 5 para realizar uma migração completa do banco de dados em uma base de código Ruby de 50 milhões de linhas, que foi concluída em um dia. Essa tarefa originalmente exigia que uma equipe inteira fosse realizada manualmente por mais de dois meses. O que é mais crítico é a eficiência: no teste de programação FrontierCode da Cognition, Fable 5 obteve a pontuação mais alta em "consumo médio de energia de computação", e a eficiência do Token é significativamente melhor do que o Claude anterior.

Isso também explica por que a Anthropic enfatiza repetidamente a eficiência do Token - um modelo que pode funcionar de forma autônoma por um longo tempo e consumir milhões de Tokens a cada passo, se ainda for "absurdo", o custo será tão alto que ninguém terá condições de usá-lo.

O progresso na visão é mais intuitivo. No passado, quando Claude jogava Pokémon Fire Red, ele precisava contar com um conjunto completo de ferramentas auxiliares para avançar aos tropeços; Fable 5 usou apenas a interface visual mais básica para completar o nível sozinho. Ele também pode restaurar o código-fonte de um aplicativo da web com apenas algumas capturas de tela.

Os especialistas internos em design de proteínas da Anthropic usaram o Mythos 5 para acelerar alguns aspectos do processo de design de medicamentos em cerca de dez vezes. A segunda é ainda mais exagerada: num estudo genómico, o Mythos 5 funcionou continuamente durante mais de uma semana num estado quase completamente autónomo, treinando sozinho um modelo de aprendizagem automática - o desempenho deste modelo excedeu o de um modelo semelhante publicado na Science, e o seu volume foi apenas um por cento deste último.

Quando um modelo consegue completar de forma independente uma semana de investigação científica e obter resultados melhores do que os resultados humanos publicados nas principais revistas, “se será usado para conceber vírus” já não é uma preocupação infundada.É exatamente por isso que a Anthropic tranca o campo da bioquímica separadamente – a mesma habilidade é um antídoto nas mãos dos pesquisadores, mas pode ser outra coisa em outro par de mãos.


Poder e perigo são duas faces da mesma moeda aqui. Os guarda-corpos não são adicionados porque o modelo não é bom, mas justamente porque é muito bom.

Pode-se observar que Anthropic descreve o Mythos como um objeto perigoso que requer supervisão total. Mas fora da narrativa oficial, também existem vozes diferentes.

Um usuário X com o ID @zekramu, que afirma ter participado de um piloto empresarial do Mythos, postou recentemente para compartilhar seus sentimentos após usá-lo por um dia inteiro - sua descrição não é totalmente consistente com a narrativa da coletiva de imprensa.

Segundo ele, a Mythos é muito forte, principalmente em tarefas de pesquisa de segurança. É obviamente melhor que a configuração mais alta do Opus e GPT-5.5, como se tivesse sido especialmente ajustado para este tipo de trabalho. Mas “forte” e “ameaçadora humanidade” são duas coisas diferentes. Ele deu um detalhe: esse modelo, que oficialmente era considerado incrível, travou na frente do processo de sua empresa baseado no Bazel (ferramenta de construção de código) e mudou muita lógica customizada. No final, ele teve que compilar o código primeiro e depois deixar o modelo rodar.


Ainda mais intrigante é o próprio guarda-corpo. De acordo com sua descrição, o que a Anthropic enviou com o modelo não foi o familiar Claude Code, mas um conjunto de ambientes operacionais projetados especificamente para “evitar a fuga do modelo” – o chamado Projeto Glasswing, em sua opinião, é em grande parte essa sandbox. No entanto, ele sentiu que o ambiente era bastante difícil e até suspeitou que algumas das restrições realmente não surtiram efeito; ele também disse que ultrapassou os limites oficiais e executou o modelo fora da caixa de areia.

Para constar, ele disse que a Mythos encontrou um grande número de vulnerabilidades de segurança anteriormente não descobertas em seus produtos, o suficiente para fazer a equipe repensar suas estratégias de segurança.

Vale a pena ponderar sua conclusão: este modelo tem duas escovas em termos de segurança, ataque e defesa, mas aos seus olhos, é mais uma ferramenta extremamente cara e extremamente especializada, ao invés do tipo de existência que “pendura sobre a cabeça de todos” como Anthropic sugere.

Voltemos ao que mais preocupa as pessoas comuns: quanto custa e quando pode ser usado.

Em termos de preço, o preço da API de Fable 5 e Mythos 5 é de US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de saídas. A comparação horizontal é interessante: em comparação com os 25/125 dólares americanos do Mythos Preview, é 60% menor; mas é duas vezes mais caro que os 5/25 dólares americanos do Opus 4.8; em comparação com o GPT-5.5 da OpenAI (5/30 dólares americanos), a entrada é duas vezes mais cara e a saída é cerca de 67% mais cara.


em outras palavras,É o Claude mais poderoso até agora e um dos modelos Claude mais caros.Forte, mas não barato.

O referido @zekramu também pode ser considerado uma prova circunstancial: Segundo sua estimativa, só o investimento na fase piloto atingiu o patamar de milhões de dólares; “muito caro” é uma frase que ele repete repetidamente.


Os assinantes também devem prestar atenção a uma janela de tempo. De hoje até 22 de junho, os usuários das edições Pro, Max, Team e Enterprise podem usar o Fable 5 gratuitamente; a partir de 23 de junho, você terá que adquirir créditos de uso adicionais para continuar usando.

A Anthropic disse que quando a capacidade de produção aumentar, fará do Fable 5 um padrão de assinatura novamente – mas não deu um horário específico. Os clientes corporativos API e pré-pagos não são afetados por esse ritmo e continuarão a ligar normalmente a partir de hoje.

Este um pouco estranho “liberte primeiro, depois carregue e depois fale sobre isso” na verdade revela um sinal: capacidade de produção insuficiente. Como ele próprio admite, a Anthropic espera que a demanda pelo Fable 5 seja “muito alta e difícil de prever”. O modelo mais forte e aberto a todos deve primeiro passar pelo nível de poder computacional.

Nesta versão, o que é realmente fácil de ignorar, mas o mais digno de parar e observar, é outra política.

A partir do Fable 5, o tráfego para todos os modelos de nível Mythos será obrigado a ser retido por 30 dias, abrangendo plataformas próprias e de terceiros.

A Anthropic promete não usar esses dados para treinar modelos, mas apenas para monitoramento de segurança, como identificar novos tipos de jailbreaks e ataques complexos que estão espalhados entre muitas solicitações e cada uma parece normal. Para isso, também adicionaram uma nova proteção de privacidade: cada visita manual é registrada e basicamente excluída após 30 dias.

Parece razoável. masPara os clientes corporativos que originalmente escolheram a Anthropic por causa da “retenção zero de dados”, esta é uma mudança que precisa ser reavaliada.

O custo de usar o modelo mais forte não é apenas uma conta mais cara, mas também: seus dados ficarão nos servidores da Anthropic por mais um mês.

Segurança e privacidade são colocadas na mesma escala aqui. A resposta dada pela Anthropic é: para evitar ataques inéditos, o tráfego de todos deve ser monitorado por 30 dias. Esta conta não é rentável e receio que cada empresa tenha de fazer os seus próprios cálculos.

Juntando tudo isso, a verdadeira novidade do Fable 5 pode não ser o quão poderoso ele é, mas o fato de ter tomado um novo caminho no Antrópico——Como pegar uma capacidade que é perigosa demais para ser divulgada e transformá-la em um produto que todos possam usar.

O método é: usar um classificador para eliminar recursos, usar downgrade em vez de rejeição e, em seguida, usar 30 dias de retenção como uma rede de monitoramento secreta.

Não é perfeito. Causará danos acidentais, ficará mais caro e fará com que algumas pessoas se preocupem com seus dados. Mas pelo menos responde a uma questão que todos os laboratórios de ponta enfrentarão mais cedo ou mais tarde: quando algo na sua mão é forte o suficiente para ferir pessoas, você tranca-o numa sala onde apenas algumas pessoas podem entrar, ou instala-lhe um guarda-corpo suficientemente forte e coloca-o nas mãos de todos?

A Antrópica escolheu o último.


Quanto a saber se esta barreira é suficientemente forte – desta vez, já não são as mais de 100 instituições que estão a fazer o teste de resistência, mas sim todas as pessoas.