F
Fireship
#Anthropic#Claude Fable 5#IA

Claude Fable 5 : Suspension, Jailbreak et Régulation de l'IA

Découvrez l'histoire de Claude Fable 5 d'Anthropic, sa brève disponibilité, le jailbreak par 'Pliny the Liberator' et la directive gouvernementale américaine qui a conduit à sa suspension mondiale, soulevant des questions sur la sécurité et la régulation de l'IA.

5 min de lectureGuide IA

Introduction

Ce document explore les événements entourant le lancement et la suspension rapide de Claude Fable 5 et Mythos 5 par Anthropic, mettant en lumière les défis de la sécurité des modèles d'IA de pointe et l'intervention gouvernementale dans leur déploiement.

Précis de configuration

Le contenu de la vidéo se concentre sur les modèles d'IA et leur gestion plutôt que sur une configuration technique spécifique. Voici les éléments clés mentionnés :

Élément Version / Lien
Modèle d'IA (brut) Claude Mythos 5 (restreint aux partenaires Glasswing)
Modèle d'IA (sécurisé) Claude Fable 5 (initialement public, puis suspendu)
Modèle d'IA (fallback) Claude Opus 4.8 (utilisé comme alternative plus 'sûre')
Développeur Anthropic
Régulateur Gouvernement des États-Unis (via le Secrétaire au Commerce Howard Lutnick)
Programme de sécurité Project Glasswing (pour Mythos 5)

Guide étape par étape

La vidéo décrit une chronologie d'événements plutôt qu'un guide de configuration. Voici les étapes clés de l'histoire de Claude Fable 5 :

Étape 1 — Introduction de Mythos 5 et Fable 5

Pourquoi : Anthropic a introduit Mythos 5 comme un modèle puissant avec de fortes capacités en cybersécurité, mais l'a initialement restreint aux partenaires de confiance via le programme Glasswing en raison de préoccupations de sécurité. Fable 5 a ensuite été lancé comme une version 'sécurisée' de Mythos 5 pour un usage général, intégrant des classificateurs de sécurité.

  • 7 avril 2026 : Introduction de Mythos 5, un modèle brut et puissant, avec des capacités avancées en cybersécurité. Il est initialement réservé aux partenaires de confiance via 'Project Glasswing'.
  • Quelques jours avant le 12 juin 2026 : Lancement de Claude Fable 5, présenté comme un modèle de classe Mythos 5 rendu 'sûr pour un usage général' grâce à l'ajout de classificateurs de sécurité.

Étape 2 — Le Jailbreak de Fable 5

Étape 2 — Le Jailbreak de Fable 5
Pourquoi : Malgré les efforts d'Anthropic pour sécuriser Fable 5 avec des 'garde-fous' (guardrails) et des milliers d'heures de tests internes et externes, un utilisateur a réussi à contourner ces mesures, démontrant la difficulté de garantir la sécurité des modèles d'IA avancés.

  • 10 juin 2026 : Un utilisateur anonyme, 'Pliny the Liberator', publie un 'jailbreak' de Fable 5 sur X (Twitter). Il affirme avoir réussi à contourner les garde-fous de Fable 5, lui permettant de produire des contenus que le modèle était censé bloquer (par exemple, des informations sur la création de cyberarmes ou de substances chimiques).
  • Techniques de jailbreak mentionnées : Utilisation de caractères Unicode étranges, homoglyphes, caractères cyrilliques, transformations de texte de style Parseltongue, suivi de référence à long contexte, raisonnement basé sur la taxonomie et la structure de document, cadrage de fiction et de narration, contextes de style d'examen académique, incohérences de classification d'intention, et décomposition/recomposition des requêtes.

Étape 3 — L'Intervention Gouvernementale et la Suspension

Pourquoi : La capacité de contourner les garde-fous de Fable 5 a été perçue comme un risque pour la sécurité nationale, poussant le gouvernement américain à intervenir pour suspendre l'accès au modèle, soulignant la tension entre l'innovation en IA et la régulation.

  • 13 juin 2026 (vendredi, 17h21 ET) : Le gouvernement américain, citant des autorités de sécurité nationale, émet une directive de contrôle des exportations. Cette directive suspend l'accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, qu'il soit aux États-Unis ou à l'étranger, y compris les employés étrangers d'Anthropic.
  • Réponse d'Anthropic : Anthropic se conforme à la directive en quelques heures, désactivant Fable 5 et Mythos 5 pour tous ses clients dans le monde entier, car il n'existe pas de moyen pratique de filtrer par nationalité en temps réel. C'est la première fois qu'un modèle d'IA de pointe déployé commercialement est retiré de force par le gouvernement.

Tableaux comparatifs des performances des modèles d'IA

Tableaux comparatifs des performances des modèles d'IA

Comparaison des modèles Claude d'Anthropic :

Modèle Description Capacités en Cybersécurité Sécurité / Garde-fous Disponibilité
Claude Mythos 5 Modèle brut, non censuré, très puissant Très fortes (83.1% en reproduction de vulnérabilité) Aucune (accès restreint aux partenaires) Restreint aux partenaires Glasswing, puis suspendu
Claude Fable 5 Version de Mythos 5 avec classificateurs de sécurité Fortes (45% dans le benchmark d'intelligence) Oui (mais contournables) Initialement public, puis suspendu
Claude Opus 4.8 Modèle moins puissant, plus 'sûr' Faibles (42.5% dans le benchmark d'intelligence) Oui (plus robustes) Disponible (utilisé comme fallback)

Benchmark d'intelligence des modèles d'IA (fuite) :

Modèle Intelligence Index (%) Développeur Notes
Mistral Le Chaton Fat 90.0 Mistral AI Modèle de référence, non encore public
Claude Fable 5 45.0 Anthropic Modèle suspendu
Claude Opus 4.8 42.5 Anthropic Modèle actuel d'Anthropic
GPT-5.5 37.7 OpenAI Modèle hypothétique/futur
GPT-5.4 36.0 OpenAI Modèle hypothétique/futur

⚠️ Erreurs fréquentes et pièges

Les