Introduction aux modèles de langage et stratégies de décodage

Extracto de la hoja de repaso

1. 📌 L'essentiel

  • Un modèle de langage estime la probabilité d'une séquence de tokens : P(w1,...,wT)=t=1TP(wtw1,...,wt1)P(w_1, ..., w_T) = \prod_{t=1}^T P(w_t | w_1, ..., w_{t-1}).
  • La tokenisation sous-mots (BPE, WordPiece, SentencePiece) réduit le vocabulaire et gère les rares.
  • Stratégies de décodage principales : Greedy, Beam Search, Sampling.
  • Greedy : choix du token le plus probable à chaque étape, rapide mais peu créatif.
  • Beam Search : exploration de plusieurs séquences, plus cohérent mais plus lent.
  • Sampling : choix probabiliste contrôlé par température, top-k, top-p pour plus de diversité.
  • La température modifie la distribution : T<1 pour plus conservateur, T>1 pour plus créatif.
  • Top-k limite la sélection aux k tokens les plus probables, renormalisés.
  • Top-p (Nucleus) sélectionne un ensemble dynamique de tokens jusqu’à la somme des probabilités p.
  • Contrôler la répétition via Repetition Penalty ou No-Repeat N-gram.
  • La graine (seed) permet la reproductibilité des résultats.
Lee la hoja completa →

Vista previa del cuestionario

1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?

2. Quelle est la principale caractéristique d’un modèle de langage?

3. Quelle est la principale fonction d'un modèle de langage (LLM) ?

Realiza el cuestionario (10 preguntas) →

Vista previa de las tarjetas de memoria

Tokenisation — rôle ?

Découpe le texte en unités manipulables

Modèle de langage — définition?

Probabiliste, prédit la prochaine token.

Modèle de langage — définition ?

Estimations probabilistes de séquences de tokens

Tokenisation — rôle?

Réduit le vocabulaire, gère l'inconnu.

Greedy — stratégie ?

Choix du token le plus probable à chaque étape

Décodage Greedy — caractéristique?

Choix du token le plus probable, rapide.

Ver las 10 tarjetas de memoria →

Preguntas frecuentes

¿Qué cubre la hoja de repaso sobre Introduction aux modèles de langage et stratégies de décodage?

La hoja de repaso cubre los conceptos esenciales de Introduction aux modèles de langage et stratégies de décodage. Está organizada por temas para facilitar el aprendizaje y la memorización, con definiciones clave, explicaciones y resúmenes.

Lee la hoja completa →

¿Cuántas preguntas tiene el cuestionario de Introduction aux modèles de langage et stratégies de décodage?

El cuestionario contiene 10 preguntas de opción múltiple con correcciones y explicaciones detalladas para cada respuesta. Ideal para poner a prueba tus conocimientos e identificar lagunas.

Realiza el cuestionario (10 preguntas) →

¿Cómo estudiar Introduction aux modèles de langage et stratégies de décodage con tarjetas de memoria?

Revizly ofrece 10 tarjetas de memoria interactivas sobre Introduction aux modèles de langage et stratégies de décodage. Cada tarjeta presenta una pregunta en el anverso y la respuesta en el reverso, permitiendo una revisión activa y efectiva basada en la repetición espaciada.

Ver las 10 tarjetas de memoria →

Similar courses

Create your own sheets from your courses

Import your PDF or paste your course, AI generates sheets, quizzes and flashcards in 30 seconds.