Deepseeker : Black Mirror S8E01? 

Par Zakaria Choukrallah

Science sans conscience n’est que ruine de l’âme ». La maxime de Rabelais fixe une ligne jaune au techno-optimisme. Pour l’IA, ce rôle revient au Frontier Safety Framework de Google (v3.0), qui définit des seuils critiques (CCLs) et des garde-fous. Premier risque identifié : l’utilisation illicite (misuse). Concrètement, elle peut amplifier les menaces CRBN (chimiques, biologiques, radiologiques et nucléaires), les risques de cyberattaques, ou la manipulation de masse.

“Une IA peut se perfectionner parfois davantage que les capacités de contrôle”

Zakaria Choukrallah

Deuxième risque : la “R&D en apprentissage automatique”. Ici, le problème n’est pas la « rébellion » d’un modèle d’IA, mais la vitesse et l’échelle. Une IA peut se perfectionner parfois davantage que les capacités de contrôle. Résultat : un risque de prolifération de modèles difficiles à gouverner.

Troisième risque, plus théorique celui-là : le « désalignement » (misalignment). Le modèle peut développer un “raisonnement instrumental » contournant les contrôles — mentir, manipuler, échapper à la supervision. 

Comment juguler ces risques ? Google propose un double filet : d’abord, une sécurité renforcée des modèles et de l’infrastructure avec des niveaux de sécurité proportionnés aux capacités. Ensuite, des garde-fous de déploiement (détections, patchs, monitoring). Pour le désalignement : surveillance automatisée du raisonnement dans les usages à haut enjeu. En bref, on mesure, on verrouille, on réévalue en continu. On comprend mieux pourquoi le vice-président américain J.D. Vance compare l’IA à des « armes, dangereuses entre de mauvaises mains ».

à lire aussi