Introduction aux modèles de langage et stratégies de décodage

Estratto della scheda di revisione

1. 📌 L'essentiel

  • Un modèle de langage estime la probabilité d'une séquence de tokens : P(w1,...,wT)=t=1TP(wtw1,...,wt1)P(w_1, ..., w_T) = \prod_{t=1}^T P(w_t | w_1, ..., w_{t-1}).
  • La tokenisation sous-mots (BPE, WordPiece, SentencePiece) réduit le vocabulaire et gère les rares.
  • Stratégies de décodage principales : Greedy, Beam Search, Sampling.
  • Greedy : choix du token le plus probable à chaque étape, rapide mais peu créatif.
  • Beam Search : exploration de plusieurs séquences, plus cohérent mais plus lent.
  • Sampling : choix probabiliste contrôlé par température, top-k, top-p pour plus de diversité.
  • La température modifie la distribution : T<1 pour plus conservateur, T>1 pour plus créatif.
  • Top-k limite la sélection aux k tokens les plus probables, renormalisés.
  • Top-p (Nucleus) sélectionne un ensemble dynamique de tokens jusqu’à la somme des probabilités p.
  • Contrôler la répétition via Repetition Penalty ou No-Repeat N-gram.
  • La graine (seed) permet la reproductibilité des résultats.
Leggi la scheda completa →

Anteprima del quiz

1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?

2. Quelle est la principale caractéristique d’un modèle de langage?

3. Quelle est la principale fonction d'un modèle de langage (LLM) ?

Fai il quiz (10 domande) →

Anteprima delle flashcard

Tokenisation — rôle ?

Découpe le texte en unités manipulables

Modèle de langage — définition?

Probabiliste, prédit la prochaine token.

Modèle de langage — définition ?

Estimations probabilistes de séquences de tokens

Tokenisation — rôle?

Réduit le vocabulaire, gère l'inconnu.

Greedy — stratégie ?

Choix du token le plus probable à chaque étape

Décodage Greedy — caractéristique?

Choix du token le plus probable, rapide.

Vedi tutte le 10 flashcard →

Domande frequenti

Cosa copre la scheda di revisione su Introduction aux modèles de langage et stratégies de décodage?

La scheda di revisione copre i concetti essenziali di Introduction aux modèles de langage et stratégies de décodage. È organizzata per argomento per facilitare l'apprendimento e la memorizzazione, con definizioni chiave, spiegazioni e riassunti.

Leggi la scheda completa →

Quante domande ci sono nel quiz su Introduction aux modèles de langage et stratégies de décodage?

Il quiz contiene 10 domande a scelta multipla con correzioni e spiegazioni dettagliate per ogni risposta. Ideale per testare le tue conoscenze e identificare le lacune.

Fai il quiz (10 domande) →

Come studiare Introduction aux modèles de langage et stratégies de décodage con le flashcard?

Revizly offre 10 flashcard interattive su Introduction aux modèles de langage et stratégies de décodage. Ogni carta presenta una domanda sul fronte e la risposta sul retro, permettendo una revisione attiva ed efficace basata sulla ripetizione dilazionata.

Vedi tutte le 10 flashcard →

Similar courses

Create your own sheets from your courses

Import your PDF or paste your course, AI generates sheets, quizzes and flashcards in 30 seconds.