Mythos, le modèle d'IA trop dangereux pour être publié

Une fuite accidentelle a révélé l'existence de Claude Mythos, un modèle d'IA capable de détecter et d'exploiter de manière autonome des failles critiques dans les logiciels les plus utilisés dans le monde monde. Face aux risques, Anthropic a restreint l'accès au modèle et fédéré plus de 40 entreprises en urgence.

Par

DR

Mythos n’est plus une légende. Anthropic, la maison mère de Claude AI, a involontairement divulgué, le 27 mars dernier, des documents internes révélant l’existence d’un modèle encore inédit portant ce patronyme. Le magazine Fortune, à l’origine de la révélation, a obtenu la confirmation d’Anthropic, qui présente ce modèle comme le plus performant jamais entraîné, avec des capacités nettement supérieures en raisonnement, en programmation et en cybersécurité.

Et c’est bien ce dernier point qui fait la particularité de Mythos, pas seulement sa puissance brute. Claude Mythos Preview (c’est son nom complet) peut ainsi détecter, analyser, et même exploiter des vulnérabilités dites “zero-day” (ces failles inconnues de tous, y compris de ceux qui ont conçu les logiciels visés). Dans un billet de blog publié le 7 avril, les chercheurs d’Anthropic indiquent que le modèle s’est montré capable d’identifier puis d’exploiter de telles failles dans tous les principaux systèmes d’exploitation et navigateurs Web, sur simple instruction d’un utilisateur, sans expertise particulière requise ! Le billet mentionne aussi des failles – sans les détailler, la grande majorité n’ayant pas encore été corrigées – touchant des systèmes de connexion, des accès non autorisés à des fonctions sensibles, ou encore des attaques pouvant supprimer des données et bloquer des services.

La suite de cet article est réservée aux abonnés.
Soutenez un média indépendant et exigeant
  • Accédez à tous les contenus de TelQuel en illimité
  • Lisez le magazine en numérique avant sa sortie en kiosque
  • Accédez à plus de 1000 numéros de TelQuel numérisés
Déjà abonné ? Se connecter