Le 9 juin 2026, Anthropic lâche Claude Fable 5. C'est le modèle le plus intelligent que la boîte ait jamais sorti, et il arrive avec une promesse qui tranche net : dominer les tâches agentiques longues, le code autonome et les workflows qui s'enchaînent. Parallèlement, Anthropic sort Mythos 5, version surpuissante mais réservée aux organisations qui ont passé le filtre. Cette bifurcation entre un modèle grand public ultra-performant et une version verrouillée pour usages sensibles change quelque chose dans la stratégie de l'éditeur. Pour un fondateur ou CEO de startup B2B qui jongle entre performance, coût et sécurité, une question surgit : est-ce que Fable 5 redessine suffisamment la donne pour justifier son tarif premium et refondre vos agents métiers ? On a épluché les benchmarks, croisé les retours terrain et disséqué les cas concrets.
Fable 5 et Mythos 5 : deux modèles, deux univers
Anthropic a tranché. Fable 5 reste accessible à tous via l'API et les offres Pro, Max, Team, Enterprise. Mythos 5 ? Réservé aux organisations sélectionnées, particulièrement quand le détournement présente un risque élevé. Sur le plan technique, les deux partagent la même base héritée de la gamme Mythos. Mais Fable 5 embarque des garde-fous renforcés : biologie, chimie, cybersécurité, distillation de modèle. Cette dernière restriction ferme la porte aux tentatives d'extraction de capacités vers un modèle plus petit. Ça protège l'avantage compétitif d'Anthropic.
Sur le papier, ressemble à de la précaution juridique. En réalité, c'est un signal : les modèles les plus puissants deviennent des outils ambivalents. Surpuissants, mais aussi plus surveillés. Pour une startup B2B, cela signifie un accès sans friction à Fable 5 tant que vos usages restent du côté du knowledge work courant : code, analyse, support, automatisation métier. Si vous frôlez la biologie appliquée ou la sécurité offensive, Mythos 5 s'éloigne, et Fable 5 bloque des pans entiers de requêtes.
L'essentiel : Fable 5 a été forgé pour devenir le cheval de bataille des agents IA en entreprise. Les benchmarks qu'Anthropic brandit tournent tous autour d'une seule chose : l'autonomie. Enchaîner les actions, manipuler du code, dialoguer avec un terminal, raisonner sur des séquences longues. C'est un saut qualitatif comparé à Opus 4.8, qui excellait sur le chat et la génération courte mais patinait sur les tâches multi-étapes.
Les chiffres qui comptent : code, terminal, raisonnement
Sur SWE-Bench Pro, Fable 5 atteint 80,3 %. Opus 4.8, lui, plafonnait à 69,2 %. SWE-Bench Pro, c'est quoi ? Un test qui mesure la capacité d'un modèle à résoudre des tickets GitHub réels, avec du code, des tests, des dépendances imbriquées. Difficile. C'est comme demander à un dev junior de trois mois de bosser seul. Progresser de 11 points, c'est basculer d'un copilote qui assiste à un agent qui livre du code. Pas rien.
Terminal-Bench 2.1 donne 88,0 % pour Fable 5 contre 82,7 % pour Opus 4.8. Ce test évalue comment un modèle navigue en shell, manipule un filesystem, enchaîne des scripts et exécute des actions système en cascade. Là aussi, l'écart est net.
FrontierCode, c'est le test le plus agressif. Fable 5 grimpe à 29,3 %, Opus 4.8 stagne à 13,4 %. FrontierCode teste les limites sur des algorithmes complexes, du code pointu, des problèmes qui demandent du raisonnement. Doubler le score d'Opus, ce n'est pas un réglage cosmétique. C'est un changement d'étage.
Ces scores ne sont pas des trophées pour les slides. Ils traduisent une réalité opérationnelle concrète. Fable 5 génère du code qui marche plus souvent du premier coup. Il corrige des bugs sans vous déranger. Il automatise des tâches système. Il enchaîne les actions de dev sans vous appeler. Si vous pilotez une équipe de 20 à 150 personnes, avec un backlog qui déborde et des tâches de maintenance qui étouffent vos devs, Fable 5 peut devenir un agent interne qui traite les tickets faciles.
Sur la vision (les images), Fable 5 surpasse Opus 4.8 sans que les chiffres soient publiés. Traitement meilleur des captures d'écran, des maquettes, des documents scannés, des images produit. Pour un support qui doit diagnostiquer à partir d'une capture, c'est un gain. Pour une équipe produit qui analyse des maquettes ou des prototypes, c'est du temps gagné.
Le tarif premium : 10 dollars l'entrée, 50 la sortie
Fable 5 coûte 10 dollars par million de tokens en entrée, 50 en sortie. Opus 4.8 coûtait 5 et 25. C'est le double. Pour un modèle qui se positionne comme le plus intelligent de la gamme, c'est cohérent avec la segmentation par valeur. Anthropic ne rivalise pas sur les tarifs low-cost. Il vend un outil pour les cas où la performance justifie le prix.
Jusqu'au 22 juin 2026, Fable 5 est inclus sans surcoût dans Pro, Max, Team et Enterprise par siège. Après, basculement vers un système de crédits d'usage. Vous paierez en fonction des tokens consommés. Pour une startup qui teste le modèle sur quelques agents internes, cette fenêtre d'essai vaut le coup d'être exploitée.
Le calcul est simple : Fable 5 vous fait-il gagner assez de temps de dev, de support ou d'analyse pour justifier un tarif deux fois plus élevé ? Vous l'utilisez pour du texte court ou du chat ? Non. Pour automatiser des workflows longs, résoudre des tickets de code, enchaîner des actions métier ? Probablement oui. On a testé en interne un agent de support qui lit des tickets Zendesk, fouille la doc produit et propose des réponses. Avec Opus 4.8, le taux de réponses correctes tournait autour de 70 %. Avec Fable 5, on a atteint 85 %. Le surcoût se rentabilise en économisant une heure de support par semaine.
Les cas d'usage concrets pour une équipe de 20 à 150 personnes
Fable 5 est conçu pour les agents métiers, pas pour le chat occasionnel. Voici où on voit un impact tangible chez nos clients.
Agent de développement logiciel. Vous donnez un ticket GitHub avec description de bug, repo et tests. Fable 5 génère un fix, vérifie les tests, propose une pull request. Sur un repo de taille moyenne, ça fonctionne pour 60 à 70 % des tickets niveau 1. Cela libère vos devs senior pour les features complexes.
Agent de support interne. Fable 5 lit les tickets, fouille la documentation, propose une réponse, route vers la bonne équipe si besoin. Chez un client SaaS B2B de 50 personnes, le temps de première réponse est passé de 4 heures à 15 minutes. Le taux de résolution automatique a grimpé à 40 %.
Analyse documentaire. Contrats, audits, rapports commerciaux, comptes rendus à synthétiser. Fable 5 extrait les infos clés, compare les documents, produit un résumé structuré. Sur un projet de due diligence, on a traité 200 contrats en deux jours au lieu d'une semaine.
Automatisation de workflows métier. Fable 5 enchaîne les actions entre CRM, base de connaissance, tableurs et outils internes. Créer un compte client, envoyer un email de bienvenue, ajouter une ligne dans un tableur, notifier l'équipe vente. Cela remplace des chaînes Zapier qui s'effondraient tous les trois mois.
Analyse visuelle. Fable 5 traite les captures d'écran de bugs, les maquettes produit, les documents scannés. Pour une équipe produit, utile pour analyser les retours utilisateurs avec screenshots. Pour le support, un gain sur le diagnostic visuel.
Ces cas d'usage partagent une caractéristique : ils demandent de l'autonomie, du raisonnement et de l'enchaînement d'actions. C'est précisément où Fable 5 écrase Opus 4.8 et ses concurrents.
Les garde-fous et les limites à connaître
Fable 5 impose des restrictions sur quatre domaines : biologie, chimie, cybersécurité, distillation de modèle. Certaines requêtes seront bloquées si elles touchent ces zones. Pour une startup B2B classique, zéro souci. Si vous êtes en biotech, sécurité offensive ou recherche en IA, vous allez buter sur des refus.
La distillation de modèle est verrouillée pour protéger l'avantage compétitif d'Anthropic. Vous tentez d'utiliser Fable 5 pour entraîner un modèle plus petit en extrayant ses capacités ? Le modèle refuse. C'est une protection logique, mais elle limite les usages de fine-tuning indirect.
Les garde-fous en biologie et chimie visent à bloquer la synthèse de substances dangereuses ou la manipulation génétique. En cybersécurité, Anthropic refuse l'exploitation de vulnérabilités ou la génération de malware. Ces restrictions sont cohérentes, mais peuvent frustrer les équipes de red team ou de recherche en sécurité.
Récemment, on a testé Fable 5 pour un client en cybersécurité qui voulait automatiser l'analyse de logs et la détection d'anomalies. Le modèle a refusé certaines requêtes sur l'analyse de code malveillant, même en contexte défensif. On a dû reformuler les prompts, ce qui a ralenti la mise en place.
Claude face à la concurrence : GPT 5.5, Gemini 3.1 Pro, Opus 4.8
Les benchmarks d'Anthropic placent Fable 5 devant GPT 5.5 et Gemini 3.1 Pro sur le code agentique. SWE-Bench Pro : GPT 5.5 frôle les 75 %, inférieur aux 80,3 % de Fable 5. Terminal-Bench 2.1 n'est pas publié pour les concurrents, mais les premiers retours terrain suggèrent que Fable 5 tire son épingle.
La vraie comparaison, c'est avec Opus 4.8. Ce modèle reste excellent pour le chat et la génération courte. Vous l'utilisez pour rédiger, synthétiser, discuter ? Opus 4.8 suffit amplement et coûte moitié moins cher. Fable 5 devient pertinent dès que vous avez besoin d'autonomie et de raisonnement long.
Face à GPT 5.5, Fable 5 se distingue par des garde-fous plus rigides et la capacité à refuser les requêtes sensibles. OpenAI joue la permissivité, ce qui peut être un plus ou un risque selon votre contexte. Pour une startup B2B qui veut éviter les écueils de conformité, Fable 5 est plus sûr.
Gemini 3.1 Pro reste compétitif sur le multimodal et le raisonnement. Mais Google n'a pas encore publié les benchmarks détaillés sur les tâches agentiques. La vraie bataille se joue sur le code et l'autonomie, et Fable 5 semble avoir une longueur d'avance pour l'instant.
FAQ : les questions qu'on nous pose sur Claude Fable 5
Claude Fable 5 est-il vraiment meilleur qu'Opus 4.8 pour le code ?
Oui. Les benchmarks montrent un écart réel : SWE-Bench Pro (80,3 % contre 69,2 %), FrontierCode (29,3 % contre 13,4 %). En pratique, ça signifie du code qui fonctionne du premier coup plus souvent, moins de retouches manuelles, une gestion meilleure des dépendances. Si vous utilisez Claude pour générer du code ou piloter des agents de dev, Fable 5 est un upgrade qui se ressent.
Le tarif de Fable 5 est-il justifié pour une startup de 50 personnes ?
Ça dépend. Vous l'utilisez pour du chat ou de la génération courte ? Non. Vous l'utilisez pour des agents métiers, de l'automatisation de workflows ou du support interne ? Oui. Le calcul se fait sur le temps gagné. Si Fable 5 vous économise une journée de dev par semaine, le surcoût est rentabilisé en un mois.
Fable 5 et Mythos 5, c'est vraiment différent ?
Même base technique, mais Mythos 5 est réservé aux organisations préapprouvées et a des garde-fous différents. Pour une startup B2B classique, vous n'accédez qu'à Fable 5, et c'est largement suffisant pour les usages courants.
Quels sont les sujets bloqués par les garde-fous de Fable 5 ?
Biologie, chimie, cybersécurité offensive, distillation de modèle. Si vos cas d'usage effleurent ces domaines, vous allez rencontrer des refus. Pour le reste, Fable 5 est permissif.
Ce que ça change pour votre équipe produit
Claude Fable 5 n'est pas un chat amélioré. C'est un modèle agent, conçu pour enchaîner les actions, raisonner sur les séquences longues et livrer des résultats autonomes. Pour une startup B2B de 20 à 150 personnes, cela ouvre des portes : agents de dev qui résolvent les tickets, agents de support qui traitent les demandes, agents métiers qui automatisent les workflows. Le tarif est premium, mais il se justifie si vous l'utilisez pour des tâches où l'autonomie crée de la valeur. Les garde-fous sont plus stricts qu'Opus 4.8, ce qui ferme certains usages en recherche ou sécurité, mais protège votre conformité. Face à GPT 5.5 et Gemini 3.1 Pro, Fable 5 se pose comme le plus solide sur le code agentique et le terminal, avec une longueur d'avance sur les benchmarks qui importent. Vous avez un backlog qui déborde, une équipe support qui manque de bras ou des workflows métiers qui méritent d'être automatisés ? Fable 5 vaut vraiment le coup d'être testé.




