Claude Fable 5 já é público e revela falhas no código que roda seus apps

Por 27 anos uma única falha ficou intacta dentro do OpenBSD, um dos sistemas operacionais em que bancos, firewalls e os servidores por trás dos sites do dia a dia confiam. Qualquer um que alcançasse a máquina por uma rede conseguia derrubá-la, e por quase três décadas ninguém percebeu. Um modelo da Anthropic chamado Mythos percebeu. Agora esse modelo tem um rosto público: a Anthropic liberou o Claude Fable 5, a primeira versão do seu sistema mais capaz que qualquer pessoa pode se cadastrar para usar.

O que torna o Fable 5 digno de atenção não é uma posição em ranking. É que o modelo por baixo lê software como um auditor experiente lê um contrato, até achar a única cláusula que quebra tudo. Dentro de um programa de pesquisa que a Anthropic chama de Project Glasswing, a versão prévia percorreu mais de mil projetos de código aberto, o código livre e compartilhado que move boa parte da internet, e apontou mais de 23.000 problemas. Mais de 10.000 eram graves o bastante para serem classificados como altos ou críticos.

O detalhe que incomodou até os próprios pesquisadores da Anthropic é que ninguém ensinou o modelo a fazer isso. A empresa diz que a capacidade de achar e explorar fraquezas nunca foi um objetivo de treino: surgiu sozinha, conforme o modelo passou a raciocinar melhor sobre código. O FFmpeg é o exemplo mais claro. Uma falha estava escondida havia 16 anos nesse software de processamento de vídeo, o motor por trás de incontáveis apps de streaming e tocadores de mídia, numa linha de código que as ferramentas de teste automático já tinham acionado cinco milhões de vezes sem nunca notar o perigo. O modelo notou.

Para a maioria das pessoas, nada disso aparece. O software que o Mythos revisou é infraestrutura invisível: o motor do navegador, o núcleo do sistema operacional, a biblioteca de mídia enterrada dentro de um celular. Mas o invisível é justamente o problema. As falhas que vieram à tona sobreviveram porque viviam em código velho demais, chato demais ou fundo demais para alguém continuar relendo. Uma ferramenta que relê tudo, sem cansar, muda as chances para quem mantém as fundações da internet e, nas mãos erradas, para quem quiser atacá-las.

Números assim só dizem algo diante de uma régua. No CyberGym, um teste que mede se um modelo consegue reproduzir uma vulnerabilidade de segurança real, o motor Mythos dentro do Fable marca 83,1 por cento, contra 66,6 por cento do Claude Opus 4.6 anterior: mais ou menos a diferença entre um analista júnior competente e um especialista que raramente erra. Os ganhos não param na segurança. A empresa de análise de dados Hex relatou que o Fable foi o primeiro modelo a passar de 90 por cento no seu teste interno, e os primeiros usuários descrevem saltos parecidos em programação, análise de dados e desenho de interfaces.

Aí vem a virada. O Fable 5 público não vai fazer justamente aquilo que o torna notável. A Anthropic isolou quatro áreas, cibersegurança, biologia, química e uma técnica de cópia chamada destilação, e quando um pedido se aproxima delas, o Fable passa em silêncio a conversa para o modelo mais antigo e mais seguro, o Claude Opus 4.8. A empresa diz que isso acontece pouco, e que os primeiros dados mostram pelo menos 95 por cento das sessões rodando inteiramente no Fable. O resultado é um produto incomum: o modelo mais capaz que a Anthropic já lançou, barrado de propósito de usar a sua habilidade mais afiada.

Esse desenho deixa perguntas que o lançamento não responde por inteiro. Uma barreira que se afasta 5 por cento das vezes ainda é uma barreira com costuras, e a linha entre explicar como um software funciona e explicar como quebrá-lo raramente é limpa. A Anthropic afirma que um programa externo de recompensa por falhas rodou mais de 1.000 horas sem achar um jeito universal de driblar os limites, mas esses são números da própria empresa, sem revisão de nenhum regulador externo. Há ainda um custo que a maioria vai sentir primeiro: o Fable 5 sai por 10 dólares por milhão de tokens de entrada e 50 por milhão de saída, as unidades aproximadas que um modelo cobra para ler e escrever, o dobro do Opus 4.8. E quem usa abre mão de algo mais silencioso, porque a Anthropic agora guarda 30 dias de dados de uso mesmo para clientes que normalmente pagam para não guardar nada, e chama isso de defesa contra o mau uso.

Por enquanto, o acesso depende de como você já usa o Claude. Quem programa chega ao Fable 5 na hora pela interface de programação da Anthropic, e uma versão separada, chamada Mythos 5, foi entregue a um grupo pequeno de organizações aprovadas de antemão, ao lado de uma coalizão da indústria que inclui Apple, Google, Microsoft, Nvidia e a Linux Foundation, todas trabalhando para corrigir o que o modelo acha antes dos atacantes. A Anthropic destinou 100 milhões de dólares em créditos de modelo e 4 milhões em doações diretas aos grupos de segurança de código aberto que fazem esse conserto.

A liberação mais ampla segue um calendário. Os assinantes dos planos Pro, Max, Team e Enterprise por assento da Anthropic recebem o Fable 5 sem custo extra até 22 de junho; a partir de 23 de junho, usá-lo consome créditos. Se as barreiras vão aguentar quando milhões de usuários novos as empurrarem é o que falta ver. O fato mais surpreendente não falta. Uma máquina já consegue ler o código por baixo da vida moderna e achar as rachaduras que escaparam de todo mundo por uma geração, e a pergunta seguinte não é mais se ela consegue, mas quem tem o direito de pedir.

Tags: segurança cibernética, tech-en1, Anthropic, modelos de IA, Project Glasswing, Claude Fable 5