Лист за преговор: Introduction aux modèles de langage et stratégies de décodage

1. 📌 L'essentiel

  • Un modèle de langage estime la probabilité d'une séquence de tokens : P(w1,...,wT)=t=1TP(wtw1,...,wt1)P(w_1, ..., w_T) = \prod_{t=1}^T P(w_t | w_1, ..., w_{t-1}).
  • La tokenisation sous-mots (BPE, WordPiece, SentencePiece) réduit le vocabulaire et gère les rares.
  • Stratégies de décodage principales : Greedy, Beam Search, Sampling.
  • Greedy : choix du token le plus probable à chaque étape, rapide mais peu créatif.
  • Beam Search : exploration de plusieurs séquences, plus cohérent mais plus lent.
  • Sampling : choix probabiliste contrôlé par température, top-k, top-p pour plus de diversité.
  • La température modifie la distribution : T<1 pour plus conservateur, T>1 pour plus créatif.
  • Top-k limite la sélection aux k tokens les plus probables, renormalisés.
  • Top-p (Nucleus) sélectionne un ensemble dynamique de tokens jusqu’à la somme des probabilités p.
  • Contrôler la répétition via Repetition Penalty ou No-Repeat N-gram.
  • La graine (seed) permet la reproductibilité des résultats.

2. 🧩 Structures & Composants clés

  • Modèle de langage : probabiliste, prédit le prochain token basé sur le contexte.
  • Tokenisation : découpe en sous-mots, gère l'inconnu.
  • Décodage :
    • Greedy : rapide, déterministe.
    • Search : exploration parallèle, k séquences.
    • Sampling : choix aléatoire, diversifié.
  • Paramètres de sampling :
    • Température (T) : contrôle la créativité.
    • Top-k : limite à k tokens.
    • Top-p : sélection dynamique jusqu’à p.
  • Contrôle des répétitions :
    • Repetition Penalty : pénalise les tokens déjà générés.
    • No-Repeat N-gram : évite la répétition de séquences.
  • Reproductibilité : seed fixe pour résultats identiques.

3. 🔬 Fonctions, Mécanismes & Relations

  • La probabilité d’une séquence est le produit des probabilités conditionnelles.
  • Tokenisation sous-mots permet une gestion efficace du vocabulaire.
  • Décodage greedy : choisit le token le plus probable, rapide mais peu créatif.
  • Beam search : explore plusieurs chemins, équilibre cohérence et complexité.
  • Sampling : introduit de la diversité, paramétré par T, top-k, top-p.
  • La température ajuste la distribution : T<1 favorise les tokens probables, T>1 augmente la diversité.
  • Top-k et top-p peuvent être combinés pour un contrôle précis.
  • La pénalité de répétition et le no_repeat_ngram évitent les boucles et répétitions excessives.
  • Le seed permet de reproduire une même séquence de génération.

4. Tableau comparatif

ÉlémentCaractéristiques clésNotes / Différences
Modèle de langageProbabiliste, calcule P(w1,...,wT)P(w_1,...,w_T)Prédiction du prochain token
TokenisationSous-mots, méthodes BPE, WordPiece, SentencePieceRéduit le vocabulaire, gère l'inconnu
Décodage GreedyMax prob, rapide, déterministePeu créatif, risque boucle
Beam SearchExploration parallèle, garde k séquencesPlus cohérent, plus lent
SamplingAléatoire, contrôlé par T, top-k, top-pPlus diversifié
Température (T)T<1 : distribution pointue, T>1 : distribution aplatieContrôle la créativité
Top-kLimite à k tokens, renormalise la probabilitéContrôle la diversité
Top-p (Nucleus)Sélectionne tokens jusqu’à la somme des prob. = pFlexible, évite rigidité
Contrôle répétitionsRepetition Penalty, No-Repeat N-gramÉvite boucle et répétitions
SeedFixe l’aléatoire pour reproductibilitéDéveloppement vs production

5. 🗂️ Diagramme Hiérarchique ASCII

Modèle de langage
 ├─ Tokenisation
 ├─ Décodage
 │   ├─ Greedy
 │   ├─ Beam Search
 │   └─ Sampling
 │       ├─ Température
 │       ├─ Top-k
 │       └─ Top-p
 ├─ Contrôle répétitions
 │   ├─ Repetition Penalty
 │   └─ No-Repeat N-gram
 └─ Reproductibilité
     └─ Seed

6. ⚠️ Pièges & Confusions fréquentes

  • Confondre greedy et beam search : le premier est déterministe, l’autre explore plusieurs chemins.
  • Croire que température T>1 diminue la diversité : c’est l’inverse, T>1 augmente la diversité.
  • Utiliser top-k ou top-p seul sans ajuster la distribution.
  • Confondre Repetition Penalty et No-Repeat N-gram : leur rôle est différent.
  • Penser que seed garantit la diversité : non, elle est contrôlée par d’autres paramètres.
  • Ne pas adapter la stratégie de décodage à la tâche : factuelle vs créative.
  • Oublier de régler max_new_tokens pour limiter la longueur.
  • Confondre probabilités conditionnelles et choix de tokens.

7. ✅ Checklist Examen Final

  • Comprendre la formule de probabilité d’une séquence.
  • Expliquer la tokenisation sous-mots et ses avantages.
  • Différencier greedy, beam search et sampling.
  • Savoir comment la température influence la distribution.
  • Connaître le fonctionnement de top-k et top-p.
  • Savoir comment éviter les répétitions avec les pénalités.
  • Expliquer l’utilité du seed pour la reproductibilité.
  • Adapter la stratégie de décodage selon la tâche.
  • Maîtriser les paramètres clés : max_new_tokens, temperature, top-k, top-p, num_beams, repetition_penalty, seed.
  • Reconnaître les pièges courants lors de la génération.
  • Savoir combiner plusieurs stratégies pour un contrôle optimal.
  • Comprendre l’impact de chaque paramètre sur la diversité et la cohérence.
  • Être capable d’interpréter un tableau comparatif des méthodes.
  • Savoir quand privilégier la rapidité ou la qualité.
  • Connaître les limites de chaque méthode de décodage.

Тествайте знанията си

Тествайте знанията си по Introduction aux modèles de langage et stratégies de décodage с 10 въпроса с множество отговори с подробни корекции.

1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?

2. Quelle est la principale caractéristique d’un modèle de langage?

Вземете теста →

Прегледайте с флашкарти

Запомнете ключовите концепции на Introduction aux modèles de langage et stratégies de décodage с 10 интерактивни флашкарти.

Tokenisation — rôle ?

Découpe le texte en unités manipulables

Modèle de langage — définition?

Probabiliste, prédit la prochaine token.

Modèle de langage — définition ?

Estimations probabilistes de séquences de tokens

Вижте флашкартите →

Similar courses

Създайте свои собствени листове за преговор

Импортирайте курса си и AI генерира листове, тестове и флашкарти за 30 секунди.

Генератор на листове