Cuestionario: Principes fondamentaux de l'apprentissage supervisé — 8 preguntas

Preguntas y respuestas detalladas

1. Quelle est la proportion typique utilisée pour diviser un ensemble de données en jeux d'apprentissage et de test selon Thierry Montaut (2023) ?

80% pour l'apprentissage et 20% pour le test
90% pour l'apprentissage et 10% pour le test
60% pour l'apprentissage et 40% pour le test
70% pour l'apprentissage et 30% pour le test

80% pour l'apprentissage et 20% pour le test

Explicación

Thierry Montaut (2023) indique que la répartition standard des données en ensembles d’apprentissage et de test est généralement de 80% pour l’apprentissage et 20% pour le test, ce qui est une règle empirique couramment adoptée pour assurer une évaluation fiable du modèle.

2. Quel est le rôle principal de l'apprentissage supervisé en machine learning ?

Apprendre une fonction à partir de données avec résultats connus
Regrouper des données non étiquetées
Découvrir des structures cachées dans des données non annotées
Optimiser une fonction sans données d'entraînement

Apprendre une fonction à partir de données avec résultats connus

Explicación

L'apprentissage supervisé consiste à apprendre une fonction à partir d'un ensemble de couples $(x, y)$ où l'on connaît le résultat $y$, permettant ainsi de prédire de nouvelles observations.

3. Qu'est-ce que l'apprentissage supervisé en machine learning?

Une méthode où l'on utilise uniquement des données de test pour ajuster le modèle.
Une approche où le modèle est ajusté uniquement sur des données non étiquetées, sans supervision.
Une technique d'apprentissage où la fonction est apprise à partir d'un ensemble de couples $(x, y)$ pour lesquels on connaît le résultat $y = f(x)$.
Une méthode où l'on entraîne un modèle sans utiliser d'étiquettes ou de résultats connus.

Une technique d'apprentissage où la fonction est apprise à partir d'un ensemble de couples $(x, y)$ pour lesquels on connaît le résultat $y = f(x)$.

Explicación

L'apprentissage supervisé consiste à apprendre une fonction à partir d’un ensemble de couples $(x, y)$ où chaque observation $x$ est associée à une étiquette $y$, permettant d’apprendre la relation $f$ entre les deux.

4. Selon Thierry Montaut (2023), quelle proportion est généralement utilisée pour diviser un ensemble de données en jeux d'entraînement et de test ?

70% pour l'entraînement, 30% pour le test
80% pour l'entraînement, 20% pour le test
90% pour l'entraînement, 10% pour le test
60% pour l'entraînement, 40% pour le test

80% pour l'entraînement, 20% pour le test

Explicación

Selon Thierry Montaut, une division typique est de 80% pour l'entraînement et 20% pour le test, permettant d'évaluer la performance du modèle sur des données non vues.

5. Quelle est la différence principale entre un problème de classification et un problème de régression ?

La classification prédit une valeur continue, la régression une valeur discrète
La classification prédit une valeur discrète, la régression une valeur continue
La classification concerne les données non étiquetées, la régression les données étiquetées
Il n'y a pas de différence, ce sont deux termes pour la même tâche

La classification prédit une valeur discrète, la régression une valeur continue

Explicación

La classification vise à prédire des étiquettes discrètes, tandis que la régression concerne la prédiction de valeurs continues.

6. Quels sont les hyper paramètres dans un modèle d'apprentissage machine ?

Les paramètres appris lors de l'entraînement
Les paramètres fixés par le concepteur du modèle
Les données d'entrée du modèle
Les résultats de la validation croisée

Les paramètres fixés par le concepteur du modèle

Explicación

Les hyper paramètres sont fixés par le développeur du modèle avant l'entraînement, comme le nombre de couches dans un réseau de neurones.

7. Quel est l’objectif principal de la validation croisée ?

Optimiser la vitesse d'entraînement
Obtenir une estimation plus stable de l'erreur de généralisation
Augmenter la taille de l'ensemble de données
Réduire la complexité du modèle

Obtenir une estimation plus stable de l'erreur de généralisation

Explicación

La validation croisée permet de partitionner les données pour évaluer la performance du modèle de manière plus fiable sur de nouvelles données.

8. Qu'indique une courbe d'apprentissage qui atteint un plateau rapidement ?

Que le modèle est sous-appris
Que le modèle est en train de surapprendre ou est déjà performant
Que le modèle ne converge pas
Que l'ensemble de données est insuffisant

Que le modèle est en train de surapprendre ou est déjà performant

Explicación

Une courbe d'apprentissage qui se stabilise rapidement suggère que le modèle a atteint sa performance optimale ou qu'il est en surapprentissage.

Repasa con tarjetas de memoria

Memoriza las respuestas con 9 tarjetas de memoria sobre Principes fondamentaux de l'apprentissage supervisé.

Apprentissage supervisé — définition ?

Apprentissage basé sur des couples $(x, y)$ pour modéliser $y = f(x)$.

Apprentissage supervisé — définition?

Apprentissage avec données étiquetées.

Données d'entraînement — rôle ?

Elles servent à ajuster la fonction $f$ en utilisant un ensemble de couples $(x, y)$.

Ver tarjetas de memoria →

Estudia la hoja de repaso

Lee la hoja de repaso completa sobre Principes fondamentaux de l'apprentissage supervisé.

Ver hoja de repaso →

Similar courses

Crea tus propios cuestionarios

Importa tu curso y la IA genera cuestionarios con correcciones en 30 segundos.

Generador de cuestionarios