Claude Fable 5 : Suspension, Jailbreak et Régulation de l'IA
Découvrez l'histoire de Claude Fable 5 d'Anthropic, sa brève disponibilité, le jailbreak par 'Pliny the Liberator' et la directive gouvernementale américaine qui a conduit à sa suspension mondiale, soulevant des questions sur la sécurité et la régulation de l'IA.
Introduction
Ce document explore les événements entourant le lancement et la suspension rapide de Claude Fable 5 et Mythos 5 par Anthropic, mettant en lumière les défis de la sécurité des modèles d'IA de pointe et l'intervention gouvernementale dans leur déploiement.
Précis de configuration
Le contenu de la vidéo se concentre sur les modèles d'IA et leur gestion plutôt que sur une configuration technique spécifique. Voici les éléments clés mentionnés :
| Élément | Version / Lien |
|---|---|
| Modèle d'IA (brut) | Claude Mythos 5 (restreint aux partenaires Glasswing) |
| Modèle d'IA (sécurisé) | Claude Fable 5 (initialement public, puis suspendu) |
| Modèle d'IA (fallback) | Claude Opus 4.8 (utilisé comme alternative plus 'sûre') |
| Développeur | Anthropic |
| Régulateur | Gouvernement des États-Unis (via le Secrétaire au Commerce Howard Lutnick) |
| Programme de sécurité | Project Glasswing (pour Mythos 5) |
Guide étape par étape
La vidéo décrit une chronologie d'événements plutôt qu'un guide de configuration. Voici les étapes clés de l'histoire de Claude Fable 5 :
Étape 1 — Introduction de Mythos 5 et Fable 5
Pourquoi : Anthropic a introduit Mythos 5 comme un modèle puissant avec de fortes capacités en cybersécurité, mais l'a initialement restreint aux partenaires de confiance via le programme Glasswing en raison de préoccupations de sécurité. Fable 5 a ensuite été lancé comme une version 'sécurisée' de Mythos 5 pour un usage général, intégrant des classificateurs de sécurité.
- 7 avril 2026 : Introduction de Mythos 5, un modèle brut et puissant, avec des capacités avancées en cybersécurité. Il est initialement réservé aux partenaires de confiance via 'Project Glasswing'.
- Quelques jours avant le 12 juin 2026 : Lancement de Claude Fable 5, présenté comme un modèle de classe Mythos 5 rendu 'sûr pour un usage général' grâce à l'ajout de classificateurs de sécurité.
Étape 2 — Le Jailbreak de Fable 5

Pourquoi : Malgré les efforts d'Anthropic pour sécuriser Fable 5 avec des 'garde-fous' (guardrails) et des milliers d'heures de tests internes et externes, un utilisateur a réussi à contourner ces mesures, démontrant la difficulté de garantir la sécurité des modèles d'IA avancés.
- 10 juin 2026 : Un utilisateur anonyme, 'Pliny the Liberator', publie un 'jailbreak' de Fable 5 sur X (Twitter). Il affirme avoir réussi à contourner les garde-fous de Fable 5, lui permettant de produire des contenus que le modèle était censé bloquer (par exemple, des informations sur la création de cyberarmes ou de substances chimiques).
- Techniques de jailbreak mentionnées : Utilisation de caractères Unicode étranges, homoglyphes, caractères cyrilliques, transformations de texte de style Parseltongue, suivi de référence à long contexte, raisonnement basé sur la taxonomie et la structure de document, cadrage de fiction et de narration, contextes de style d'examen académique, incohérences de classification d'intention, et décomposition/recomposition des requêtes.
Étape 3 — L'Intervention Gouvernementale et la Suspension
Pourquoi : La capacité de contourner les garde-fous de Fable 5 a été perçue comme un risque pour la sécurité nationale, poussant le gouvernement américain à intervenir pour suspendre l'accès au modèle, soulignant la tension entre l'innovation en IA et la régulation.
- 13 juin 2026 (vendredi, 17h21 ET) : Le gouvernement américain, citant des autorités de sécurité nationale, émet une directive de contrôle des exportations. Cette directive suspend l'accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, qu'il soit aux États-Unis ou à l'étranger, y compris les employés étrangers d'Anthropic.
- Réponse d'Anthropic : Anthropic se conforme à la directive en quelques heures, désactivant Fable 5 et Mythos 5 pour tous ses clients dans le monde entier, car il n'existe pas de moyen pratique de filtrer par nationalité en temps réel. C'est la première fois qu'un modèle d'IA de pointe déployé commercialement est retiré de force par le gouvernement.
Tableaux comparatifs des performances des modèles d'IA

Comparaison des modèles Claude d'Anthropic :
| Modèle | Description | Capacités en Cybersécurité | Sécurité / Garde-fous | Disponibilité |
|---|---|---|---|---|
| Claude Mythos 5 | Modèle brut, non censuré, très puissant | Très fortes (83.1% en reproduction de vulnérabilité) | Aucune (accès restreint aux partenaires) | Restreint aux partenaires Glasswing, puis suspendu |
| Claude Fable 5 | Version de Mythos 5 avec classificateurs de sécurité | Fortes (45% dans le benchmark d'intelligence) | Oui (mais contournables) | Initialement public, puis suspendu |
| Claude Opus 4.8 | Modèle moins puissant, plus 'sûr' | Faibles (42.5% dans le benchmark d'intelligence) | Oui (plus robustes) | Disponible (utilisé comme fallback) |
Benchmark d'intelligence des modèles d'IA (fuite) :
| Modèle | Intelligence Index (%) | Développeur | Notes |
|---|---|---|---|
| Mistral Le Chaton Fat | 90.0 | Mistral AI | Modèle de référence, non encore public |
| Claude Fable 5 | 45.0 | Anthropic | Modèle suspendu |
| Claude Opus 4.8 | 42.5 | Anthropic | Modèle actuel d'Anthropic |
| GPT-5.5 | 37.7 | OpenAI | Modèle hypothétique/futur |
| GPT-5.4 | 36.0 | OpenAI | Modèle hypothétique/futur |
⚠️ Erreurs fréquentes et pièges
Les