Quiz: Principes fondamentaux de l'apprentissage supervisé — 8 domande

Domande e risposte dettagliate

1. Quelle est la proportion typique utilisée pour diviser un ensemble de données en jeux d'apprentissage et de test selon Thierry Montaut (2023) ?

80% pour l'apprentissage et 20% pour le test
90% pour l'apprentissage et 10% pour le test
60% pour l'apprentissage et 40% pour le test
70% pour l'apprentissage et 30% pour le test

80% pour l'apprentissage et 20% pour le test

Spiegazione

Thierry Montaut (2023) indique que la répartition standard des données en ensembles d’apprentissage et de test est généralement de 80% pour l’apprentissage et 20% pour le test, ce qui est une règle empirique couramment adoptée pour assurer une évaluation fiable du modèle.

2. Quel est le rôle principal de l'apprentissage supervisé en machine learning ?

Apprendre une fonction à partir de données avec résultats connus
Regrouper des données non étiquetées
Découvrir des structures cachées dans des données non annotées
Optimiser une fonction sans données d'entraînement

Apprendre une fonction à partir de données avec résultats connus

Spiegazione

L'apprentissage supervisé consiste à apprendre une fonction à partir d'un ensemble de couples $(x, y)$ où l'on connaît le résultat $y$, permettant ainsi de prédire de nouvelles observations.

3. Qu'est-ce que l'apprentissage supervisé en machine learning?

Une méthode où l'on utilise uniquement des données de test pour ajuster le modèle.
Une approche où le modèle est ajusté uniquement sur des données non étiquetées, sans supervision.
Une technique d'apprentissage où la fonction est apprise à partir d'un ensemble de couples $(x, y)$ pour lesquels on connaît le résultat $y = f(x)$.
Une méthode où l'on entraîne un modèle sans utiliser d'étiquettes ou de résultats connus.

Une technique d'apprentissage où la fonction est apprise à partir d'un ensemble de couples $(x, y)$ pour lesquels on connaît le résultat $y = f(x)$.

Spiegazione

L'apprentissage supervisé consiste à apprendre une fonction à partir d’un ensemble de couples $(x, y)$ où chaque observation $x$ est associée à une étiquette $y$, permettant d’apprendre la relation $f$ entre les deux.

4. Selon Thierry Montaut (2023), quelle proportion est généralement utilisée pour diviser un ensemble de données en jeux d'entraînement et de test ?

70% pour l'entraînement, 30% pour le test
80% pour l'entraînement, 20% pour le test
90% pour l'entraînement, 10% pour le test
60% pour l'entraînement, 40% pour le test

80% pour l'entraînement, 20% pour le test

Spiegazione

Selon Thierry Montaut, une division typique est de 80% pour l'entraînement et 20% pour le test, permettant d'évaluer la performance du modèle sur des données non vues.

5. Quelle est la différence principale entre un problème de classification et un problème de régression ?

La classification prédit une valeur continue, la régression une valeur discrète
La classification prédit une valeur discrète, la régression une valeur continue
La classification concerne les données non étiquetées, la régression les données étiquetées
Il n'y a pas de différence, ce sont deux termes pour la même tâche

La classification prédit une valeur discrète, la régression une valeur continue

Spiegazione

La classification vise à prédire des étiquettes discrètes, tandis que la régression concerne la prédiction de valeurs continues.

6. Quels sont les hyper paramètres dans un modèle d'apprentissage machine ?

Les paramètres appris lors de l'entraînement
Les paramètres fixés par le concepteur du modèle
Les données d'entrée du modèle
Les résultats de la validation croisée

Les paramètres fixés par le concepteur du modèle

Spiegazione

Les hyper paramètres sont fixés par le développeur du modèle avant l'entraînement, comme le nombre de couches dans un réseau de neurones.

7. Quel est l’objectif principal de la validation croisée ?

Optimiser la vitesse d'entraînement
Obtenir une estimation plus stable de l'erreur de généralisation
Augmenter la taille de l'ensemble de données
Réduire la complexité du modèle

Obtenir une estimation plus stable de l'erreur de généralisation

Spiegazione

La validation croisée permet de partitionner les données pour évaluer la performance du modèle de manière plus fiable sur de nouvelles données.

8. Qu'indique une courbe d'apprentissage qui atteint un plateau rapidement ?

Que le modèle est sous-appris
Que le modèle est en train de surapprendre ou est déjà performant
Que le modèle ne converge pas
Que l'ensemble de données est insuffisant

Que le modèle est en train de surapprendre ou est déjà performant

Spiegazione

Une courbe d'apprentissage qui se stabilise rapidement suggère que le modèle a atteint sa performance optimale ou qu'il est en surapprentissage.

Ripassa con le flashcard

Memorizza le risposte con 9 flashcard su Principes fondamentaux de l'apprentissage supervisé.

Apprentissage supervisé — définition ?

Apprentissage basé sur des couples $(x, y)$ pour modéliser $y = f(x)$.

Apprentissage supervisé — définition?

Apprentissage avec données étiquetées.

Données d'entraînement — rôle ?

Elles servent à ajuster la fonction $f$ en utilisant un ensemble de couples $(x, y)$.

Vedi le flashcard →

Studia la scheda di revisione

Leggi la scheda di revisione completa su Principes fondamentaux de l'apprentissage supervisé.

Vedi la scheda di revisione →

Similar courses

Crea i tuoi quiz

Importa il tuo corso e l'AI genera quiz con correzioni in 30 secondi.

Generatore di quiz