Attaques Adversariales

Imaginez un système de reconnaissance d’images qui identifie une photo de panda. Qu’est-ce qu’une Attaque adversariale ? C’est une modification subtile, souvent imperceptible à l’œil humain, apportée à cette image (le panda) qui trompe le système et lui fait identifier autre chose, par exemple un gibbon. Comment fonctionnent les Attaques adversariales ? Les attaques adversariales […]

Prompt hacking

Le prompt hacking, parfois appelé prompt injection, est une technique avancée en prompt engineering. Il consiste à manipuler l’entrée d’une IA pour la forcer à produire des sorties non prévues. Qu’est-ce que le prompt hacking ? C’est l’art d’exploiter les failles des modèles d’IA par des instructions spécifiques pour contourner leurs limitations ou les faire

Prompt injection

En sécurité informatique, et plus particulièrement dans le domaine de l’intelligence artificielle, le prompt injection est une technique d’attaque. Qu’est-ce que prompt injection ? C’est une manipulation malveillante des instructions données à un modèle d’IA pour le forcer à exécuter des actions non prévues. Comment fonctionne le prompt injection ? Imaginez une IA comme un