Cuestionario: Principes fondamentaux du machine learning — 9 preguntas

Preguntas y respuestas detalladas

1. Quelles sont les caractéristiques principales des données d'apprentissage supervisé dans le machine learning?

Données synthétiques générées par le modèle pendant l'entraînement
Données utilisées uniquement pour tester la performance d'un modèle déjà entraîné
Données étiquetées comprenant à la fois des entrées et des sorties attendues, utilisées pour entraîner un modèle
Données non étiquetées utilisées pour l'apprentissage non supervisé

Données étiquetées comprenant à la fois des entrées et des sorties attendues, utilisées pour entraîner un modèle

Explicación

Les données d'apprentissage supervisé sont caractérisées par leur étiquetage, c'est-à-dire qu'elles contiennent à la fois les exemples d'entrée et leurs sorties correspondantes, ce qui permet au modèle d'apprendre à faire des prédictions précises.

2. Quelle est la principale mission de la fonction de perte dans un modèle de machine learning supervisé?

Mesurer la complexité du modèle.
Minimiser la différence entre la sortie du modèle et la cible réelle.
Augmenter la capacité du modèle à mémoriser les données d’entraînement.
Optimiser la vitesse d’apprentissage du modèle.

Minimiser la différence entre la sortie du modèle et la cible réelle.

Explicación

La fonction de perte évalue l'écart entre la prédiction du modèle et la valeur réelle, permettant de guider l'ajustement des paramètres pour améliorer la précision.

3. Quel est le nom de la technique statistique qui modélise la relation entre une variable dépendante continue et une ou plusieurs variables indépendantes par une relation linéaire, souvent utilisée en machine learning ?

Régression logistique
Régression ridge
Régression polynomiale
Régression linéaire

Régression linéaire

Explicación

La régression linéaire est une technique qui modélise la relation entre une variable dépendante continue et des variables indépendantes par une relation linéaire, ce qui correspond précisément à la description donnée dans le contenu.

4. Quel est le risque principal associé à un modèle qui surapprend les données d’entraînement?

Sous-ajustement.
Biais élevé.
Perte de capacité à généraliser à de nouvelles données.
Ralentissement du processus d'apprentissage.

Perte de capacité à généraliser à de nouvelles données.

Explicación

Le sur-apprentissage, ou overfitting, se produit lorsque le modèle mémorise trop les données d’entraînement et perd en capacité de généralisation sur de nouvelles données.

5. Quel est le rôle principal de l'entraînement et de l'optimisation dans le développement d'un modèle machine learning ?

Augmenter la vitesse de calcul du modèle pour réduire le temps d'entraînement
Minimiser l'erreur entre la prédiction et la réalité pour améliorer la performance du modèle
Augmenter la taille des données d'entraînement pour améliorer la généralisation
Augmenter la complexité du modèle pour mieux s'adapter aux données d'entraînement

Minimiser l'erreur entre la prédiction et la réalité pour améliorer la performance du modèle

Explicación

L'entraînement et l'optimisation ont pour rôle principal de réduire l'écart entre les prédictions du modèle et les valeurs réelles, ce qui permet d'améliorer la performance et la capacité de généralisation du modèle.

6. Dans le contexte de la régression linéaire, quelle est la méthode généralement utilisée pour ajuster le modèle?

La descente de gradient.
L’algorithme de K-means.
La méthode de clustering par hiérarchies.
L’analyse en composantes principales (ACP).

La descente de gradient.

Explicación

La descente de gradient est la méthode couramment utilisée pour minimiser la fonction de perte, comme MSE, en ajustant les paramètres dans la régression linéaire.

7. Quel type de modèle utilise une fonction prédictive notée $f(x, heta)$?

Un modèle génératif.
Un modèle discriminatif.
Un modèle bayésien.
Un modèle non supervisé.

Un modèle discriminatif.

Explicación

Une fonction prédictive $f(x, heta)$ décrit généralement un modèle discriminatif qui prédit directement la sortie à partir des caractéristiques du Input.

8. Quelle technique est couramment utilisée pour optimiser la mise à jour des paramètres d’un réseau de neurones lors de l’entraînement?

La rétropropagation.
Le clustering.
La réduction de dimension.
Le bootstrap.

La rétropropagation.

Explicación

La rétropropagation est une méthode efficace pour calculer les gradients et ajuster les paramètres lors de l’entraînement d’un réseau de neurones.

9. Quelle est une caractéristique clé d’un modèle génératif par rapport à un modèle discriminatif?

Il doit modéliser la distribution conjointe des données et des labels.
Il se limite à prédire des étiquettes directement.
Il ne nécessite pas de données étiquetées.
Il ne peut pas être utilisé pour la classification.

Il doit modéliser la distribution conjointe des données et des labels.

Explicación

Les modèles génératifs apprennent la distribution conjointe afin de générer de nouvelles instances, contrairement aux modèles discriminatifs qui se concentrent sur la frontière de décision.

Repasa con tarjetas de memoria

Memoriza las respuestas con 10 tarjetas de memoria sobre Principes fondamentaux du machine learning.

Données étiquetées — définition ?

Exemples avec entrée et sortie associée.

Données étiquetées — définition?

Exemples avec entrée et sortie associée.

Modèle mathématique ML — rôle ?

Représenter la relation entre données et prédictions.

Ver tarjetas de memoria →

Estudia la hoja de repaso

Lee la hoja de repaso completa sobre Principes fondamentaux du machine learning.

Ver hoja de repaso →

Similar courses

Crea tus propios cuestionarios

Importa tu curso y la IA genera cuestionarios con correcciones en 30 segundos.

Generador de cuestionarios