Espace de données d’apprentissage — composants ?
Features, labels, représentation numérique
Dataset — sous-ensembles principaux ?
Training, validation, test
Features numériques — types ?
Continue, discrète
Features catégorielles — encodages ?
Ordinal, one-hot
Sortie problème ML — nature ?
Régression ou classification
Qualité des données — problèmes courants ?
Données manquantes, incohérences, outliers
Transformation — objectif principal ?
Rendre les données exploitables
Feature engineering — actions ?
Sélection, création, réduction de dimension
Phases apprentissage — ordre ?
Préparation, entraînement, validation, test
Validation croisée — but ?
Évaluer stabilité et généralisation
Métriques de régression — exemple ?
MSE, MAE, RMSE, R²
Matrice confusion — éléments ?
TP, TN, FP, FN
Erreur quadratique moyenne — sigification ?
Pénalise grosses erreurs
R² — interprétation ?
Part de variance expliquée
Validation stratifiée — avantage ?
Conserve proportions de classes
Normalisation — but ?
Comparer features sur même échelle
Standardisation — formule ?
(x - μ)/σ
Discrétisation — utilité ?
Simplifier ou interpréter
Sur-apprentissage — signe ?
Bonne performance train, mauvaise test
Metti alla prova le tue conoscenze con 20 domande su Introduction aux données et validation en ML.
1. Que représente l’espace de données d’apprentissage dans un problème supervisé ?
2. Dans une représentation matricielle des données, que désigne généralement X ?
Ripassa il corso completo nella scheda di revisione per Introduction aux données et validation en ML.
Vedi la scheda di revisione →Bases de données
Bases de données
Bases de données
Programmation
Importa il tuo corso e l'AI genera flashcard in 30 secondi.
Generatore di flashcard