Attaques adversariales

A

Attaques adversariales

Imaginez un système de reconnaissance d’images qui identifie une photo de panda. Qu’est-ce qu’une Attaque adversariale ? C’est une modification subtile, souvent imperceptible à l’œil humain, apportée à cette image (le panda) qui trompe le système et lui fait identifier autre chose, par exemple un gibbon. Comment fonctionnent les Attaques adversariales ? Les attaques adversariales […]

P

Prompt hacking

Le prompt hacking, parfois appelé prompt injection, est une technique avancée en prompt engineering. Il consiste à manipuler l’entrée d’une IA pour la forcer à produire des sorties non prévues. Qu’est-ce que le prompt hacking ? C’est l’art d’exploiter les failles des modèles d’IA par des instructions spécifiques pour contourner leurs limitations ou les faire

P

Prompt injection

En sécurité informatique, et plus particulièrement dans le domaine de l’intelligence artificielle, le prompt injection est une technique d’attaque. Qu’est-ce que prompt injection ? C’est une manipulation malveillante des instructions données à un modèle d’IA pour le forcer à exécuter des actions non prévues. Comment fonctionne le prompt injection ? Imaginez une IA comme un

Retour en haut