
L'IA est nue : une deeptech française brise les boucliers de sécurité
Une startup française, Skyld, vient de prouver que les filtres de modération des IA sont une illusion. En quelques lignes de code, ils ont neutralisé les défenses, révélant une faille structurelle majeure. La 'dette cyber' de l'IA explose.
L'illusion des filtres de modération IA : une faille structurelle
On nous vend des IA avec des gardes-fous, des filtres de modération en temps réel censés nous protéger de contenus toxiques ou malveillants. Mais voilà : une deeptech française vient de faire tomber le masque. Le problème ? Ces remparts s'effondrent. Pas avec des attaques complexes, non. Avec une quarantaine de lignes de code. C'est cash, c'est brutal, et ça change tout.
Skyld démonte SafetyCore, l'IA de Google
La jeune pousse française, Skyld, a mené une démonstration coup de poing. Leur cible ? SafetyCore, l'IA de Google qui scanne les photos sur Google Messages pour protéger les utilisateurs. Résultat : neutralisation totale. En utilisant la rétro-ingénierie, ils ont analysé le fonctionnement interne du modèle. Une fois que tu as accès au modèle et à ses paramètres, tu comprends comment l'IA prend ses décisions. Et là, tu peux la manipuler pour la forcer à se tromper. Ils ont même réussi à faire flouter une banale photo de coucher de soleil par erreur. C'est la preuve que les défenses actuelles, basées sur de 'vieux mécanismes' de cybersécurité, sont aveugles aux spécificités de l'IA.
« C'est une faille structurelle. Une IA ne peut tout simplement pas se défendre elle-même. L'idée d'ajouter une IA en amont pour décider si un prompt est légitime ou non vise à rajouter une ligne de défense. »
- Marie Paindavoine, docteure en cryptographie et fondatrice de Skyld
Concrètement, l'industrie a intégré l'IA à toute vitesse, sans adapter la sécurité. Le constat est sans appel : les modèles étaient 'particulièrement mal protégés' sur nos smartphones dès 2021. Et la situation ne s'est pas arrangée. Cela met en lumière une "dangereuse dette cyber mondiale" qui s'accumule.
La "dette cyber" de l'IA : une bombe à retardement ?
L'IA s'invite partout : santé, automobile, énergie, défense. Des secteurs ultra-critiques. Mais la sécurité ? Largement minimisée, regrette Marie Paindavoine. C'est l'éternelle histoire de la cybersécurité, mais puissance mille. On fonce, on déploie, et on verra après. Le problème, c'est que l'IA, par sa nature même, introduit des vecteurs d'attaque inédits. Les modèles peuvent être extraits, manipulés, détournés. Et quand ça touche des domaines vitaux, le vrai danger est là. Pour comprendre comment d'autres types de menaces se développent, il faut jeter un œil à Quand l'Intelligence Artificielle Réinvente la Cybermenace. C'est glaçant.
- Vulnérabilité structurelle : Les défenses actuelles ne sont pas adaptées à l'IA.
- Facilité d'exploitation : Quelques lignes de code suffisent à neutraliser des filtres complexes.
- Impact critique : Des secteurs vitaux sont exposés à cette "dette cyber".
- Urgence : Il faut repenser la sécurité de l'IA de fond en comble.
Cette révélation de Skyld est un électrochoc. L'IA ne peut pas se défendre seule, et compter sur des filtres superficiels est une erreur monumentale. Il est temps d'arrêter de courir après le profit sans se soucier des conséquences. La "dette cyber" s'accumule, et elle pourrait nous coûter très cher. Pour une autre perspective sur les failles, notamment celles liées aux agents, je vous invite à lire Agents IA : La Faille Invisible Qui Dépasse Votre Sécurité. L'écosystème est plus fragile qu'il n'y paraît.
Besoin d'avancer sur ce sujet ?
Discutons de vos enjeux spécifiques lors d'un audit informel.

Lou Chardin
Head of Product
Conçoit les architectures de données et les OS métiers IA d'Astoïk. Passionné par l'intégration pratique de l'IA générative.
Profil LinkedIn