Introduction aux modèles de langage et stratégies de décodage

Trecho da ficha de revisão

1. 📌 L'essentiel

  • Un modèle de langage estime la probabilité d'une séquence de tokens : P(w1,...,wT)=t=1TP(wtw1,...,wt1)P(w_1, ..., w_T) = \prod_{t=1}^T P(w_t | w_1, ..., w_{t-1}).
  • La tokenisation sous-mots (BPE, WordPiece, SentencePiece) réduit le vocabulaire et gère les rares.
  • Stratégies de décodage principales : Greedy, Beam Search, Sampling.
  • Greedy : choix du token le plus probable à chaque étape, rapide mais peu créatif.
  • Beam Search : exploration de plusieurs séquences, plus cohérent mais plus lent.
  • Sampling : choix probabiliste contrôlé par température, top-k, top-p pour plus de diversité.
  • La température modifie la distribution : T<1 pour plus conservateur, T>1 pour plus créatif.
  • Top-k limite la sélection aux k tokens les plus probables, renormalisés.
  • Top-p (Nucleus) sélectionne un ensemble dynamique de tokens jusqu’à la somme des probabilités p.
  • Contrôler la répétition via Repetition Penalty ou No-Repeat N-gram.
  • La graine (seed) permet la reproductibilité des résultats.
Leia a ficha completa →

Prévia do quiz

1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?

2. Quelle est la principale caractéristique d’un modèle de langage?

3. Quelle est la principale fonction d'un modèle de langage (LLM) ?

Faça o quiz (10 perguntas) →

Prévia dos flashcards

Tokenisation — rôle ?

Découpe le texte en unités manipulables

Modèle de langage — définition?

Probabiliste, prédit la prochaine token.

Modèle de langage — définition ?

Estimations probabilistes de séquences de tokens

Tokenisation — rôle?

Réduit le vocabulaire, gère l'inconnu.

Greedy — stratégie ?

Choix du token le plus probable à chaque étape

Décodage Greedy — caractéristique?

Choix du token le plus probable, rapide.

Veja todos os 10 flashcards →

Perguntas frequentes

O que a ficha de revisão sobre Introduction aux modèles de langage et stratégies de décodage cobre?

A ficha de revisão cobre os conceitos essenciais de Introduction aux modèles de langage et stratégies de décodage. Está organizada por tópicos para facilitar o aprendizado e a memorização, com definições chave, explicações e resumos.

Leia a ficha completa →

Quantas perguntas há no quiz de Introduction aux modèles de langage et stratégies de décodage?

O quiz contém 10 perguntas de múltipla escolha com correções e explicações detalhadas para cada resposta. Ideal para testar seu conhecimento e identificar lacunas.

Faça o quiz (10 perguntas) →

Como estudar Introduction aux modèles de langage et stratégies de décodage com flashcards?

Revizly oferece 10 flashcards interativos sobre Introduction aux modèles de langage et stratégies de décodage. Cada cartão apresenta uma pergunta na frente e a resposta no verso, permitindo uma revisão ativa e eficaz baseada na repetição espaçada.

Veja todos os 10 flashcards →

Similar courses

Create your own sheets from your courses

Import your PDF or paste your course, AI generates sheets, quizzes and flashcards in 30 seconds.