Quiz: Introduction au Machine Learning — 24 domande

Domande e risposte dettagliate

1. Comment définir le machine learning dans le cadre de l’intelligence artificielle ?

Une méthode de programmation explicite basée sur des règles codées à la main
Un sous-ensemble de l’intelligence artificielle qui apprend à partir de données pour prédire ou décider
Un ensemble de techniques qui remplacent toujours les algorithmes classiques
Une branche de la statistique qui ne traite que des données non annotées

Un sous-ensemble de l’intelligence artificielle qui apprend à partir de données pour prédire ou décider

Spiegazione

Le machine learning est présenté comme un sous-ensemble de l’IA où des algorithmes apprennent à partir de données pour faire des prédictions ou des décisions. Il ne repose pas sur une programmation explicite de la tâche.

2. Dans quelles situations le machine learning est-il particulièrement adapté ?

Quand la sortie du modèle doit toujours être une classe binaire
Quand les données d’entraînement sont inutiles pour apprendre
Quand un algorithme conventionnel est difficile ou impossible à concevoir efficacement
Quand il faut écrire une suite de règles simples et parfaitement connues

Quand un algorithme conventionnel est difficile ou impossible à concevoir efficacement

Spiegazione

Le machine learning est indiqué comme une alternative adaptée lorsque la conception d’un algorithme conventionnel est difficile ou impossible. Il apprend alors à partir des données plutôt que de règles codées à l’avance.

3. Quelle est la première grande étape du processus de machine learning supervisé ?

La phase de pré-traitement des données
La phase d’évaluation sur des données jamais vues
La phase de comparaison avec des données de test
La phase de déploiement du modèle en production

La phase de pré-traitement des données

Spiegazione

Le processus supervisé commence par le pré-traitement, avant l’apprentissage puis l’évaluation. L’évaluation vient après la construction du modèle.

4. À quoi sert principalement le jeu de test dans un processus de machine learning ?

À remplacer complètement le jeu d’entraînement
À évaluer le modèle sur des données nouvelles non utilisées pour l’apprentissage
À ajuster les paramètres du modèle pendant l’apprentissage
À construire la matrice des caractéristiques d’entraînement

À évaluer le modèle sur des données nouvelles non utilisées pour l’apprentissage

Spiegazione

Le jeu de test est réservé à l’évaluation du modèle sur des données non utilisées pendant l’apprentissage. Cela permet d’estimer sa généralisation sur de nouvelles entrées.

5. Quel type d’apprentissage automatique consiste à prédire une sortie à partir de paires entrée/sortie connues ?

L’apprentissage par transfert
L’apprentissage par renforcement
L’apprentissage non supervisé
L’apprentissage supervisé

L’apprentissage supervisé

Spiegazione

L’apprentissage supervisé s’appuie sur des exemples annotés, c’est-à-dire des paires entrée/sortie. L’objectif est d’apprendre à prédire la sortie à partir de l’entrée.

6. Quel type d’apprentissage vise à choisir des actions pour maximiser des récompenses au fil du temps ?

L’apprentissage par validation croisée
L’apprentissage supervisé
L’apprentissage par renforcement
L’apprentissage non supervisé

L’apprentissage par renforcement

Spiegazione

L’apprentissage par renforcement est défini par l’interaction avec un environnement et des récompenses. Le but est d’optimiser les actions au cours du temps.

7. En apprentissage supervisé, que prédit un problème de classification ?

Une matrice de distances entre observations
Une valeur numérique continue
Une étiquette parmi des classes prédéfinies
Un ensemble de règles non paramétriques

Une étiquette parmi des classes prédéfinies

Spiegazione

La classification consiste à prédire une étiquette choisie parmi des classes prédéfinies. La régression, elle, vise une valeur continue.

8. Que cherche à prédire un problème de régression ?

Une étiquette discrète parmi plusieurs classes
Le nombre de caractéristiques du modèle
La forme exacte du jeu de données
Une valeur numérique continue

Une valeur numérique continue

Spiegazione

En régression, la variable cible est une valeur numérique continue. Cela la distingue de la classification, qui prédit une classe.

9. Qu’est-ce que le surapprentissage ?

Un modèle qui généralise mieux grâce à une grande complexité
Un modèle qui ne peut pas être évalué sur un jeu de test
Un modèle qui apprend trop bien l’entraînement mais généralise mal
Un modèle qui ignore totalement les données d’entraînement

Un modèle qui apprend trop bien l’entraînement mais généralise mal

Spiegazione

Le surapprentissage apparaît quand le modèle s’adapte trop aux données d’entraînement et se généralise mal. Il performe donc bien sur l’entraînement mais moins bien sur de nouvelles données.

10. Quel est l’intérêt principal de la validation croisée face à un seul découpage train-test ?

Forcer le modèle à être moins complexe
Remplacer la prédiction par une simple moyenne
Réduire le risque d’un résultat dû au hasard d’un seul découpage
Supprimer la nécessité d’un jeu d’entraînement

Réduire le risque d’un résultat dû au hasard d’un seul découpage

Spiegazione

La validation croisée évalue le modèle sur plusieurs découpages, ce qui limite l’effet d’un split chanceux. Elle donne ainsi une estimation plus stable de la généralisation.

11. Quel est l’objectif principal de l’analyse exploratoire des données ?

Comprendre les variables, repérer les erreurs et les valeurs aberrantes
Remplacer l’entraînement du modèle par des graphiques
Convertir automatiquement les données en classes
Choisir uniquement le meilleur algorithme final

Comprendre les variables, repérer les erreurs et les valeurs aberrantes

Spiegazione

L’analyse exploratoire sert à explorer les données avec des méthodes statistiques et graphiques pour en comprendre la structure. Elle aide aussi à repérer les anomalies et les valeurs aberrantes.

12. Quel graphique est particulièrement utile pour visualiser la relation entre deux variables numériques ?

Le boxplot
L’histogramme
Le nuage de points
La matrice de confusion

Le nuage de points

Spiegazione

Le nuage de points est utilisé pour visualiser les relations entre deux variables numériques. Le boxplot et l’histogramme servent plutôt à décrire la distribution d’une variable.

13. Que désigne la variable cible dans un modèle supervisé ?

La liste des hyperparamètres du modèle
La sortie que le modèle cherche à prédire
Le seuil de décision choisi après l’entraînement
Le nombre de variables explicatives

La sortie que le modèle cherche à prédire

Spiegazione

La variable cible est la sortie à prédire par le modèle. Elle correspond au label en classification ou à la valeur numérique en régression.

14. Que représente une donnée catégorielle nominale ?

Une catégorie sans ordre, comme une couleur ou une marque
Une valeur numérique continue
Une catégorie avec ordre naturel
Une variable destinée à être prédite

Une catégorie sans ordre, comme une couleur ou une marque

Spiegazione

Une variable nominale décrit des groupes sans ordre, comme les couleurs ou les marques. Elle se distingue d’une variable ordinale, qui possède un ordre.

15. Sur quel principe repose la méthode des k plus proches voisins ?

Sur une pénalisation des coefficients du modèle
Sur la moyenne de toutes les observations du jeu de données
Sur une séparation linéaire apprise par optimisation
Sur les k observations les plus proches dans l’espace des caractéristiques

Sur les k observations les plus proches dans l’espace des caractéristiques

Spiegazione

KNN prédit à partir des k observations les plus proches dans l’espace des caractéristiques. La décision dépend donc de la proximité mesurée entre points.

16. En classification KNN, comment la prédiction finale est-elle généralement déterminée ?

Par la somme pondérée de tous les exemples
Par la médiane des valeurs des voisins
Par la classe majoritaire parmi les voisins
Par le coefficient le plus grand du modèle

Par la classe majoritaire parmi les voisins

Spiegazione

En classification KNN, la sortie est donnée par la classe majoritaire parmi les voisins. En régression, on utilise plutôt la moyenne des valeurs voisines.

17. Quelle est la paire correcte de méthodes en Python pour entraîner puis prédire avec un modèle ?

fit() puis predict()
split() puis merge()
predict() puis fit()
transform() puis score()

fit() puis predict()

Spiegazione

En Python, l’apprentissage se fait avec fit() et la prédiction avec predict(). C’est l’enchaînement standard pour entraîner puis utiliser un modèle.

18. Dans KNN, pourquoi dit-on que la méthode est non paramétrique ?

Parce qu’elle impose une fonction de coût quadratique
Parce qu’elle mémorise les observations de l’ensemble d’apprentissage
Parce qu’elle apprend uniquement des coefficients linéaires
Parce qu’elle n’utilise jamais de données d’entraînement

Parce qu’elle mémorise les observations de l’ensemble d’apprentissage

Spiegazione

KNN est non paramétrique car il mémorise les observations de l’ensemble d’apprentissage au lieu d’estimer une forme fonctionnelle fixe. La prédiction repose ensuite sur les voisins les plus proches.

19. Pourquoi réalise-t-on un train-test split ?

Pour mesurer la performance sur des données jamais vues pendant l’entraînement
Pour entraîner et tester sur exactement les mêmes données
Pour augmenter artificiellement la taille du jeu de test
Pour supprimer les variables catégorielles du jeu de données

Pour mesurer la performance sur des données jamais vues pendant l’entraînement

Spiegazione

Le train-test split permet d’évaluer la généralisation sur des données non vues pendant l’entraînement. Il aide ainsi à limiter une estimation trop optimiste due au surapprentissage.

20. Comment la prédiction finale d’une forêt aléatoire se fait-elle en régression ?

Par vote majoritaire
Par choix du plus petit arbre
Par la médiane des variables explicatives
Par moyenne des prédictions des arbres

Par moyenne des prédictions des arbres

Spiegazione

En régression, une forêt aléatoire agrège les arbres par moyenne des prédictions. En classification, l’agrégation se fait par vote majoritaire.

21. Que minimise la méthode des moindres carrés ordinaires en régression linéaire ?

Le nombre de caractéristiques utilisées
L’erreur quadratique sur les données
La somme des erreurs absolues
La variance des variables explicatives

L’erreur quadratique sur les données

Spiegazione

Les moindres carrés ordinaires choisissent les paramètres en minimisant l’erreur quadratique. C’est le principe central de l’estimation en régression linéaire.

22. Quelle forme prend le modèle de régression linéaire multiple ?

Une pénalité ajoutée aux coefficients
Une fonction de décision fondée sur des voisins
Une combinaison linéaire des caractéristiques plus un biais
Une somme de classes pondérées par des distances

Une combinaison linéaire des caractéristiques plus un biais

Spiegazione

La régression linéaire multiple relie la cible à plusieurs caractéristiques par une combinaison linéaire avec un biais. Les coefficients sont ajustés pendant l’apprentissage.

23. Quelle est la particularité principale de la régularisation ridge ?

Elle remplace la régression par une classification
Elle ajoute une pénalité L2 pour limiter la taille des coefficients
Elle choisit uniquement les variables catégorielles
Elle peut forcer certains coefficients à zéro

Elle ajoute une pénalité L2 pour limiter la taille des coefficients

Spiegazione

Ridge ajoute une pénalité L2 qui réduit l’amplitude des coefficients et aide à limiter le surapprentissage. Contrairement au lasso, elle ne vise pas à annuler explicitement certains coefficients.

24. Quel effet caractérise le lasso ?

Il pénalise les coefficients et peut en annuler certains exactement
Il transforme la régression en modèle non supervisé
Il impose une distance entre les observations
Il maximise la variance des prédictions

Il pénalise les coefficients et peut en annuler certains exactement

Spiegazione

Le lasso utilise une pénalité L1 qui peut pousser certains coefficients exactement à zéro. Il sert donc aussi à sélectionner des variables.

Ripassa con le flashcard

Memorizza le risposte con 24 flashcard su Introduction au Machine Learning.

Intelligence artificielle — définition ?

Ensemble de techniques visant à simuler l’intelligence humaine.

Machine learning — rôle ?

Algorithmes qui apprennent à partir de données pour faire des prédictions.

Données d’entraînement — fonction ?

Fournissent l’exemple pour construire un modèle.

Vedi le flashcard →

Studia la scheda di revisione

Leggi la scheda di revisione completa su Introduction au Machine Learning.

Vedi la scheda di revisione →

Similar courses

Crea i tuoi quiz

Importa il tuo corso e l'AI genera quiz con correzioni in 30 secondi.

Generatore di quiz