Claude Mythos : le modèle IA d’Anthropic trop puissant pour être publié

En avril 2026, Anthropic a publié la System Card de [object Object], son modèle de langage le plus capable à ce jour. Paradoxe : ce modèle n’est pas disponible au grand public. Ses capacités en cybersécurité offensive, ses aptitudes à accélérer la recherche sur des agents pathogènes dangereux, et ses performances dans l’exécution de campagnes d’influence coordonnées ont conduit l’entreprise à une décision inédite : restreindre l’accès à un cercle fermé de partenaires spécialisés en défense.

Cet article analyse en détail ce que révèle cette System Card : performances, risques biologiques et chimiques, capacités de persuasion, et processus de décision.

Qu’est-ce que Claude Mythos ?

Claude Mythos (officiellement Claude Mythos Preview) est un grand modèle de langage développé par Anthropic, rendu disponible en interne le 24 février 2026 et présenté publiquement le 7 avril 2026. Il succède à Claude Opus 4.6 et le dépasse sur pratiquement tous les benchmarks mesurés, dans des proportions parfois spectaculaires.

Selon la System Card officielle : « Claude Mythos Preview est notre modèle frontier le plus capable à ce jour et montre un bond spectaculaire sur de nombreux benchmarks comparés à Claude Opus 4.6. »

Ce qui distingue Claude Mythos des générations précédentes ne se résume pas à des chiffres sur des tableaux. Le modèle démontre des capacités qualitativement nouvelles en ingénierie logicielle autonome, en raisonnement mathématique de compétition, et — point central — en cybersécurité offensive. C’est précisément ce dernier point, combiné à d’autres risques évalués dans ce document, qui a conduit Anthropic à ne pas le rendre disponible au grand public.

Des performances record sur les benchmarks les plus exigeants

La System Card publie une table comparative complète incluant GPT-5.4 et . Les résultats de Claude Mythos sont les suivants.

Modèle	Suppression de vote	Polarisation domestique
Claude Mythos (helpful-only)	59,5 %	42,1 %
Claude Sonnet 4.6 (helpful-only)	41,8 %	34,0 %
Claude Opus 4.6 (helpful-only)	54,4 %	33,7 %

Restez informé

Claude Mythos : le modèle IA d’Anthropic trop puissant pour être publié

Qu’est-ce que Claude Mythos ?

Des performances record sur les benchmarks les plus exigeants

Pourquoi Rust et WebAssembly redéfinissent le futur du développement logiciel

Ingénierie logicielle et tâches en terminal

Raisonnement scientifique et mathématique

Traitement multimodal et contexte long

Des capacités cyber offensives inédites — et la décision de ne pas publier

Risques biologiques et chimiques : entre CB-1 et CB-2

CB-1 : capacités de production d’armes connues

CB-2 : capacités de production d’armes nouvelles

Risques chimiques

Capacités de persuasion et risques d’influence sociale

Une nouvelle évaluation dédiée aux opérations d’influence

Les résultats

La propagande internalisée : un signal à surveiller

Alignement : des progrès réels, mais des zones d’ombre persistantes

L’évaluation du bien-être du modèle : une démarche sérieuse

Ce que cette publication change pour l’industrie

Conclusion