| Élément | Caractéristiques clés | Notes / Différences |
|---|---|---|
| Modèle de langage | Probabiliste, calcule | Prédiction du prochain token |
| Tokenisation | Sous-mots, méthodes BPE, WordPiece, SentencePiece | Réduit le vocabulaire, gère l'inconnu |
| Décodage Greedy | Max prob, rapide, déterministe | Peu créatif, risque boucle |
| Beam Search | Exploration parallèle, garde k séquences | Plus cohérent, plus lent |
| Sampling | Aléatoire, contrôlé par T, top-k, top-p | Plus diversifié |
| Température (T) | T<1 : distribution pointue, T>1 : distribution aplatie | Contrôle la créativité |
| Top-k | Limite à k tokens, renormalise la probabilité | Contrôle la diversité |
| Top-p (Nucleus) | Sélectionne tokens jusqu’à la somme des prob. = p | Flexible, évite rigidité |
| Contrôle répétitions | Repetition Penalty, No-Repeat N-gram | Évite boucle et répétitions |
| Seed | Fixe l’aléatoire pour reproductibilité | Développement vs production |
Modèle de langage
├─ Tokenisation
├─ Décodage
│ ├─ Greedy
│ ├─ Beam Search
│ └─ Sampling
│ ├─ Température
│ ├─ Top-k
│ └─ Top-p
├─ Contrôle répétitions
│ ├─ Repetition Penalty
│ └─ No-Repeat N-gram
└─ Reproductibilité
└─ Seed
Teste seu conhecimento sobre Introduction aux modèles de langage et stratégies de décodage com 10 perguntas de múltipla escolha com correções detalhadas.
1. Quelle stratégie de décodage consiste à choisir à chaque étape le token le plus probable, de manière rapide et déterministe ?
2. Quelle est la principale caractéristique d’un modèle de langage?
Memorize os conceitos chave de Introduction aux modèles de langage et stratégies de décodage com 10 flashcards interativos.
Tokenisation — rôle ?
Découpe le texte en unités manipulables
Modèle de langage — définition?
Probabiliste, prédit la prochaine token.
Modèle de langage — définition ?
Estimations probabilistes de séquences de tokens
Intelligence Artificielle
Bases de données
Bases de données
Importe seu curso e a IA gera fichas, quizzes e flashcards em 30 segundos.
Gerador de fichas