Claude Fable 5 volta ao ar após EUA retirarem bloqueio emergencial

Cyber Security Brazil
há 1 dia
5 min de leitura

A Anthropic voltou a disponibilizar mundialmente o Claude Fable 5 após o Departamento de Comércio dos Estados Unidos suspender, em 30 de junho, os controles de exportação impostos ao modelo e ao Mythos 5 cerca de duas semanas e meia antes. O Fable 5 retorna aos usuários em 1º de julho, com acesso pelo Claude.ai, Claude Platform, Claude Code e Claude Cowork.

A medida encerra, ao menos por enquanto, uma disputa envolvendo segurança de modelos avançados de IA, risco de uso dual, competição internacional e a ausência de um processo regulatório claro para respostas rápidas do governo americano diante de possíveis capacidades perigosas em sistemas de fronteira.

Os controles de exportação restringem quem pode receber ou usar determinada tecnologia. A ordem de 12 de junho determinava que a Anthropic interrompesse o acesso aos modelos Fable 5 e Mythos 5 para qualquer cidadão estrangeiro, dentro ou fora dos Estados Unidos, incluindo funcionários não cidadãos da própria empresa.

Como a regra entrou em vigor imediatamente e a Anthropic não tinha uma forma confiável de verificar em tempo real a nacionalidade de todos os usuários, a companhia decidiu retirar ambos os modelos do ar para todos. Na prática, uma restrição voltada a usuários estrangeiros levou à suspensão global temporária do acesso.

O gatilho para a decisão foi um jailbreak identificado por pesquisadores da Amazon no Fable 5. Jailbreaks são prompts ou técnicas criadas para fazer um modelo contornar suas regras de segurança. Segundo a Anthropic, o prompt fazia o modelo sinalizar algumas falhas de software e, em um caso, escrever código demonstrando como uma vulnerabilidade poderia ser abusada.

A Anthropic minimizou a gravidade da descoberta. A empresa afirmou que solicitações semelhantes funcionam em vários modelos considerados menos avançados, incluindo seu próprio Claude Opus 4.8, o GPT-5.5 da OpenAI e o Kimi K2.7, da China. Para a companhia, o comportamento apontado estava mais próximo de atividades rotineiras de segurança defensiva do que de uma capacidade oculta e extraordinária.

O governo americano e o parceiro que relatou o jailbreak, no entanto, trataram o caso como suficientemente sério para justificar controles emergenciais. A preocupação central era que um modelo capaz de ajudar defensores a encontrar e corrigir falhas também pudesse ser usado por agentes maliciosos para acelerar a descoberta e exploração de vulnerabilidades.

Para responder à preocupação, a Anthropic treinou um novo filtro de segurança, chamado de classificador, voltado a identificar a técnica exata descrita no relatório. Segundo a empresa, o mecanismo passou a bloquear mais de 99% das tentativas relacionadas a esse método, conforme publicação de 30 de junho.

Quando uma solicitação é bloqueada, ela passa a ser encaminhada ao modelo mais fraco Claude Opus 4.8, e o usuário é informado. A empresa reconhece, porém, que essa abordagem tem um custo: aumento de falsos positivos em tarefas legítimas de programação, depuração e análise de código.

O Mythos 5, descrito como o mesmo modelo subjacente, mas com menos barreiras de segurança, permanece sob controle mais rígido. O acesso foi restabelecido em 26 de junho para cerca de 100 empresas americanas e agências federais envolvidas na defesa de infraestrutura crítica. A Anthropic afirma que ainda trabalha com o governo para ampliar o acesso.

O secretário de Comércio dos EUA, Howard Lutnick, responsável pela reversão, afirmou que o departamento passou duas semanas revisando os modelos junto com a Anthropic. Em uma carta, a empresa concordou em buscar problemas de segurança por conta própria, coordenar lançamentos futuros e reportar usos maliciosos que venha a identificar.

As negociações teriam sido conduzidas pelo cofundador Tom Brown, e não pelo CEO Dario Amodei, que vinha enfrentando atritos com a administração americana ao longo do ano. A disputa também foi marcada por ruído político e competitivo desde o início.

Relatos de veículos como The Wall Street Journal indicaram que a pesquisa da Amazon e preocupações do CEO Andy Jassy ajudaram a impulsionar a ordem original. O ex-czar de IA David Sacks acusou a Anthropic de ter priorizado a continuidade da oferta do modelo de consumo em detrimento da segurança. Outros analistas interpretaram a resposta do governo como um exagero.

Francesco Bailo, pesquisador de governança de IA da Universidade de Sydney, disse à Al Jazeera que a reversão parecia indicar que o governo havia reconhecido ter ido longe demais. Um grupo de líderes de segurança também assinou uma carta aberta pedindo a suspensão dos controles.

A disputa ocorreu em meio à crescente competição internacional em IA. A pausa no acesso aos modelos americanos veio em um momento no qual modelos chineses open source, mais baratos e cada vez mais capazes, vinham ganhando espaço. Executivos do setor alertaram que congelar modelos dos Estados Unidos poderia dar tempo adicional para concorrentes estrangeiros avançarem.

Além de restaurar o Fable 5, a Anthropic está propondo algo que ainda falta à indústria: uma forma compartilhada de classificar a gravidade de jailbreaks. Em colaboração com Amazon, Microsoft, Google e outros parceiros, a empresa quer avaliar cada técnica com base em quatro critérios principais.

O primeiro é o ganho de capacidade, ou seja, até que ponto o jailbreak leva o usuário além das ferramentas e capacidades que ele já teria. O segundo é a amplitude, medindo quantos tipos diferentes de ataque uma mesma técnica desbloqueia. O terceiro é a facilidade de weaponization, isto é, quanto conhecimento e esforço são necessários para transformar a técnica em um ataque real. O quarto é a descobribilidade, que avalia quão fácil é encontrar, copiar ou reproduzir o método.

Para os casos mais graves, como jailbreaks capazes de permitir ataques contra redes elétricas, bancos ou outras infraestruturas críticas, a Anthropic afirma que começará a implementar correções assim que a severidade for confirmada. A empresa também está criando uma equipe para acompanhar relatos de jailbreaks de forma contínua.

A companhia abriu ainda um programa no HackerOne para que pesquisadores reportem novos jailbreaks no Fable 5. Como parte dos compromissos assumidos, a Anthropic também prometeu ao governo dos Estados Unidos acesso antecipado para testar futuros modelos de fronteira antes do lançamento.

A Anthropic não é a única empresa pressionada por esse dilema. Dias antes, a OpenAI apresentou o GPT-5.6 a um grupo pequeno e aprovado pelo governo, em vez de abrir o acesso ao público, citando a mesma preocupação de uso dual. O problema é estrutural: um modelo bom o suficiente para ajudar defensores a corrigir vulnerabilidades também pode ser útil para atacantes encontrarem e explorarem falhas.

O risco não é apenas teórico. No início do ano, a Anthropic testou uma versão anterior do Mythos que encontrou e explorou vulnerabilidades zero-day sob comando em grandes sistemas operacionais e navegadores, incluindo uma falha de 27 anos no OpenBSD. A equipe de red team da empresa também conseguiu transformar falhas recém-divulgadas em exploits funcionais em menos de um dia.

A crise imediata envolvendo o Fable 5 foi resolvida com a suspensão dos controles emergenciais, mas a questão regulatória permanece aberta. Uma ordem executiva de 2 de junho criou um caminho voluntário para que empresas submetam modelos de fronteira a revisão antes do lançamento. Também estabeleceu um benchmark classificado para definir quais modelos seriam considerados “cobertos”, mas descartou a exigência de licença obrigatória para disponibilizar um modelo.

O Fable 5 não passou por esse caminho. Em vez disso, o governo recorreu a controles de exportação, uma ferramenta tradicionalmente usada para restringir acesso a tecnologias sensíveis. O episódio mostra que, quando Washington precisa agir rapidamente sobre um modelo de fronteira, ainda não há um processo obrigatório e bem definido, apenas respostas improvisadas.

Cyber Security Brazil

QUERO ANUNCIAR

Claude Fable 5 volta ao ar após EUA retirarem bloqueio emergencial

Posts recentes