Espace de données d’apprentissage — composants ?
Features, labels, représentation numérique
Dataset — sous-ensembles principaux ?
Training, validation, test
Features numériques — types ?
Continue, discrète
Features catégorielles — encodages ?
Ordinal, one-hot
Sortie problème ML — nature ?
Régression ou classification
Qualité des données — problèmes courants ?
Données manquantes, incohérences, outliers
Transformation — objectif principal ?
Rendre les données exploitables
Feature engineering — actions ?
Sélection, création, réduction de dimension
Phases apprentissage — ordre ?
Préparation, entraînement, validation, test
Validation croisée — but ?
Évaluer stabilité et généralisation
Métriques de régression — exemple ?
MSE, MAE, RMSE, R²
Matrice confusion — éléments ?
TP, TN, FP, FN
Erreur quadratique moyenne — sigification ?
Pénalise grosses erreurs
R² — interprétation ?
Part de variance expliquée
Validation stratifiée — avantage ?
Conserve proportions de classes
Normalisation — but ?
Comparer features sur même échelle
Standardisation — formule ?
(x - μ)/σ
Discrétisation — utilité ?
Simplifier ou interpréter
Sur-apprentissage — signe ?
Bonne performance train, mauvaise test
Teste seu conhecimento com 20 perguntas sobre Introduction aux données et validation en ML.
1. Que représente l’espace de données d’apprentissage dans un problème supervisé ?
2. Dans une représentation matricielle des données, que désigne généralement X ?
Revise o curso completo na ficha de revisão para Introduction aux données et validation en ML.
Veja a ficha de revisão →Intelligence Artificielle
Bases de données
Bases de données
Bases de données
Importe seu curso e a IA gera flashcards em 30 segundos.
Gerador de flashcards