Quiz: Introduction aux Méthodes de Classification — 9 perguntas

Perguntas e respostas detalhadas

1. Quelles sont les deux étapes du processus de classification ?

Nettoyer les données puis supprimer les classes rares
Choisir un seuil puis supprimer les observations mal classées
Construire le modèle sur les données d’apprentissage puis l’utiliser pour classer de nouvelles données
Calculer d’abord l’AUC puis la matrice de confusion

Construire le modèle sur les données d’apprentissage puis l’utiliser pour classer de nouvelles données

Explicação

Le processus se déroule en deux temps : d’abord l’apprentissage du modèle sur le training set, puis son utilisation pour prédire de nouvelles observations. Les autres propositions mélangent des étapes d’évaluation avec l’apprentissage.

2. Dans quel type de problème la classification peut-elle être utilisée ?

Calculer la moyenne d’une variable numérique
Attribuer un niveau de risque à partir de données démographiques
Modifier les variables d’entrée pour les rendre comparables
Mesurer la distance entre deux groupes de données

Attribuer un niveau de risque à partir de données démographiques

Explicação

Le cours cite l’usage de données démographiques pour attribuer une note de risque et estimer une probabilité de maladie. C’est bien un problème de classification, car il s’agit d’assigner une classe ou une étiquette.

3. Quelle affirmation décrit correctement la courbe ROC et l’AUC ?

L’AUC mesure le nombre d’erreurs de classification sur le train set
La courbe ROC trace le taux de vrais positifs en fonction du taux de faux positifs pour différents seuils, et l’AUC résume cette performance globale
La courbe ROC ne dépend pas du seuil de décision
La courbe ROC compare uniquement l’accuracy de deux modèles

La courbe ROC trace le taux de vrais positifs en fonction du taux de faux positifs pour différents seuils, et l’AUC résume cette performance globale

Explicação

La courbe ROC relie le taux de vrais positifs et le taux de faux positifs pour divers seuils de classification, et l’AUC en résume la qualité globale. Quand le seuil baisse, les deux taux ont tendance à augmenter.

4. Quel est le principe d’une validation croisée ?

Découper le train set en k sous-ensembles et répéter k évaluations en utilisant à chaque fois un sous-ensemble pour tester
Utiliser uniquement le test set pour entraîner plusieurs modèles
Conserver une seule découpe fixe des données pour éviter toute variabilité
Remplacer la matrice de confusion par une courbe ROC

Découper le train set en k sous-ensembles et répéter k évaluations en utilisant à chaque fois un sous-ensemble pour tester

Explicação

La validation croisée entraîne et valide le modèle sur plusieurs découpages possibles du train set, avec k−1 sous-ensembles pour apprendre et 1 pour tester à chaque tour. Cela réduit la dépendance à une seule partition.

5. Que mesure le F1 score ?

La surface sous la courbe ROC
Une moyenne harmonique entre précision et rappel
La proportion totale de bonnes prédictions
Le nombre de faux positifs uniquement

Une moyenne harmonique entre précision et rappel

Explicação

Le F1 score combine précision et rappel via leur moyenne harmonique, ce qui pénalise les déséquilibres entre les deux. Il est utile quand un modèle privilégie la précision et un autre le rappel.

6. Quelle définition décrit le mieux la classification en apprentissage supervisé ?

Attribuer à chaque entité une catégorie parmi un ensemble de classes à partir de ses caractéristiques
Estimer une valeur continue à partir d’observations passées
Réduire la dimension d’un jeu de données pour faciliter l’analyse
Regrouper des données sans étiquette en sous-ensembles homogènes

Attribuer à chaque entité une catégorie parmi un ensemble de classes à partir de ses caractéristiques

Explicação

La classification consiste à prédire l’appartenance d’une entité à une classe parmi plusieurs classes possibles. En apprentissage supervisé, les étiquettes sont connues à l’avance grâce à des exemples annotés.

7. À quoi sert principalement un train test split ?

À choisir automatiquement la meilleure classe positive
À séparer les données en apprentissage et test pour estimer le taux d’erreur sur des données inconnues
À transformer une classification binaire en classification multi-classes
À mélanger toutes les données pour améliorer l’accuracy

À séparer les données en apprentissage et test pour estimer le taux d’erreur sur des données inconnues

Explicação

Le train test split divise les données en deux ensembles indépendants afin d’évaluer la généralisation du modèle. Le taux d’erreur est alors estimé sur le test, pas sur les données d’apprentissage.

8. Que permet de faire une matrice de confusion ?

Calculer la distance entre les observations
Estimer la taille optimale du jeu d’apprentissage
Choisir directement le meilleur seuil sans autre information
Comparer les prédictions du modèle aux classes réelles et dénombrer VP, VN, FP et FN

Comparer les prédictions du modèle aux classes réelles et dénombrer VP, VN, FP et FN

Explicação

La matrice de confusion est un tableau de comptage qui confronte prédictions et classes réelles pour obtenir les vrais positifs, vrais négatifs, faux positifs et faux négatifs. Elle sert de base au calcul de plusieurs indicateurs d’évaluation.

9. Comment se calcule la précision en classification binaire ?

Vrais positifs plus vrais négatifs divisés par le total
Faux positifs divisés par vrais positifs plus faux positifs
Vrais positifs divisés par vrais positifs plus faux négatifs
Vrais positifs divisés par vrais positifs plus faux positifs

Vrais positifs divisés par vrais positifs plus faux positifs

Explicação

La précision mesure la proportion de prédictions positives qui sont réellement correctes, soit VP/(VP+FP). Le rappel, lui, utilise les faux négatifs au dénominateur, ce qui en fait une autre métrique.

Revisar com flashcards

Memorize as respostas com 18 flashcards sobre Introduction aux Méthodes de Classification.

Classification — définition ?

Prédire l’appartenance à une catégorie.

Classes — rôle ?

Groupes cibles à identifier.

Apprentissage supervisé — rôle ?

Utilise des données étiquetées.

Veja os flashcards →

Estude a ficha de revisão

Leia a ficha de revisão completa sobre Introduction aux Méthodes de Classification.

Veja a ficha de revisão →

Similar courses

Crie seus próprios quizzes

Importe seu curso e a IA gera quizzes com correções em 30 segundos.

Gerador de quizzes