En intelligence artificielle et en prompt engineering, le Top-K est une méthode de sélection des réponses les plus probables générées par un modèle. Qu’est-ce que Top-K ? C’est une technique qui sélectionne les K résultats les plus probables parmi un ensemble de prédictions, K étant un nombre entier que vous définissez.
Comment fonctionne Top-K ?
Top-K filtre les prédictions d’un modèle en ne conservant que les K plus probables. Imaginez que vous demandiez à un modèle de compléter la phrase « J’aime manger des… ». Parmi des milliers de possibilités, le modèle attribue une probabilité à chaque mot. Avec Top-K = 3, seules les trois suggestions les plus probables, par exemple « pommes », « bananes » et « fraises », seront conservées. Les autres, même si plausibles, seront ignorées. Le choix de la valeur de K influence directement la créativité et la précision des réponses. Un K faible privilégie la précision mais peut être limitant, tandis qu’un K élevé favorise la diversité mais augmente le risque d’erreurs.
Pourquoi Top-K est-il important ?
Top-K est crucial pour contrôler la pertinence et la diversité des réponses d’un modèle. En prompt engineering, il permet d’affiner les résultats et de réduire le bruit, notamment lors de la génération de texte. Par exemple, si vous générez un poème, un Top-K faible privilégiera des rimes courantes et un style conventionnel. Un Top-K élevé, en revanche, pourrait produire des rimes plus originales, voire inattendues, augmentant la créativité du poème au risque d’incohérences.
Termes associés
- **Temperature:** Paramètre qui contrôle la « créativité » du modèle en influençant la distribution de probabilité.
- **Top-P (nucleus sampling):** Méthode alternative de sélection des prédictions basée sur un seuil de probabilité cumulative.
- **Prompt Engineering:** Discipline qui vise à optimiser les instructions données aux modèles d’IA pour obtenir les meilleurs résultats.