Quiz: Introduction au Machine Learning — 24 domande

Question 1

1. Comment définir le machine learning dans le cadre de l’intelligence artificielle ?

Une méthode de programmation explicite basée sur des règles codées à la main

Un sous-ensemble de l’intelligence artificielle qui apprend à partir de données pour prédire ou décider

Un ensemble de techniques qui remplacent toujours les algorithmes classiques

Une branche de la statistique qui ne traite que des données non annotées

Spiegazione

Le machine learning est présenté comme un sous-ensemble de l’IA où des algorithmes apprennent à partir de données pour faire des prédictions ou des décisions. Il ne repose pas sur une programmation explicite de la tâche.

Answer

Un sous-ensemble de l’intelligence artificielle qui apprend à partir de données pour prédire ou décider

Question 2

2. Dans quelles situations le machine learning est-il particulièrement adapté ?

Quand la sortie du modèle doit toujours être une classe binaire

Quand les données d’entraînement sont inutiles pour apprendre

Quand un algorithme conventionnel est difficile ou impossible à concevoir efficacement

Quand il faut écrire une suite de règles simples et parfaitement connues

Spiegazione

Le machine learning est indiqué comme une alternative adaptée lorsque la conception d’un algorithme conventionnel est difficile ou impossible. Il apprend alors à partir des données plutôt que de règles codées à l’avance.

Answer

Quand un algorithme conventionnel est difficile ou impossible à concevoir efficacement

Question 3

3. Quelle est la première grande étape du processus de machine learning supervisé ?

La phase de pré-traitement des données

La phase d’évaluation sur des données jamais vues

La phase de comparaison avec des données de test

La phase de déploiement du modèle en production

Spiegazione

Le processus supervisé commence par le pré-traitement, avant l’apprentissage puis l’évaluation. L’évaluation vient après la construction du modèle.

Answer

La phase de pré-traitement des données

Question 4

4. À quoi sert principalement le jeu de test dans un processus de machine learning ?

À remplacer complètement le jeu d’entraînement

À évaluer le modèle sur des données nouvelles non utilisées pour l’apprentissage

À ajuster les paramètres du modèle pendant l’apprentissage

À construire la matrice des caractéristiques d’entraînement

Spiegazione

Le jeu de test est réservé à l’évaluation du modèle sur des données non utilisées pendant l’apprentissage. Cela permet d’estimer sa généralisation sur de nouvelles entrées.

Answer

À évaluer le modèle sur des données nouvelles non utilisées pour l’apprentissage

Question 5

5. Quel type d’apprentissage automatique consiste à prédire une sortie à partir de paires entrée/sortie connues ?

L’apprentissage par transfert

L’apprentissage par renforcement

L’apprentissage non supervisé

L’apprentissage supervisé

Spiegazione

L’apprentissage supervisé s’appuie sur des exemples annotés, c’est-à-dire des paires entrée/sortie. L’objectif est d’apprendre à prédire la sortie à partir de l’entrée.

Answer

L’apprentissage supervisé

Question 6

6. Quel type d’apprentissage vise à choisir des actions pour maximiser des récompenses au fil du temps ?

L’apprentissage par validation croisée

L’apprentissage supervisé

L’apprentissage par renforcement

L’apprentissage non supervisé

Spiegazione

L’apprentissage par renforcement est défini par l’interaction avec un environnement et des récompenses. Le but est d’optimiser les actions au cours du temps.

Answer

L’apprentissage par renforcement

Question 7

7. En apprentissage supervisé, que prédit un problème de classification ?

Une matrice de distances entre observations

Une valeur numérique continue

Une étiquette parmi des classes prédéfinies

Un ensemble de règles non paramétriques

Spiegazione

La classification consiste à prédire une étiquette choisie parmi des classes prédéfinies. La régression, elle, vise une valeur continue.

Answer

Une étiquette parmi des classes prédéfinies

Question 8

8. Que cherche à prédire un problème de régression ?

Une étiquette discrète parmi plusieurs classes

Le nombre de caractéristiques du modèle

La forme exacte du jeu de données

Une valeur numérique continue

Spiegazione

En régression, la variable cible est une valeur numérique continue. Cela la distingue de la classification, qui prédit une classe.

Answer

Une valeur numérique continue

Question 9

9. Qu’est-ce que le surapprentissage ?

Un modèle qui généralise mieux grâce à une grande complexité

Un modèle qui ne peut pas être évalué sur un jeu de test

Un modèle qui apprend trop bien l’entraînement mais généralise mal

Un modèle qui ignore totalement les données d’entraînement

Spiegazione

Le surapprentissage apparaît quand le modèle s’adapte trop aux données d’entraînement et se généralise mal. Il performe donc bien sur l’entraînement mais moins bien sur de nouvelles données.

Answer

Un modèle qui apprend trop bien l’entraînement mais généralise mal

Question 10

10. Quel est l’intérêt principal de la validation croisée face à un seul découpage train-test ?

Forcer le modèle à être moins complexe

Remplacer la prédiction par une simple moyenne

Réduire le risque d’un résultat dû au hasard d’un seul découpage

Supprimer la nécessité d’un jeu d’entraînement

Spiegazione

La validation croisée évalue le modèle sur plusieurs découpages, ce qui limite l’effet d’un split chanceux. Elle donne ainsi une estimation plus stable de la généralisation.

Answer

Réduire le risque d’un résultat dû au hasard d’un seul découpage

Question 11

11. Quel est l’objectif principal de l’analyse exploratoire des données ?

Comprendre les variables, repérer les erreurs et les valeurs aberrantes

Remplacer l’entraînement du modèle par des graphiques

Convertir automatiquement les données en classes

Choisir uniquement le meilleur algorithme final

Spiegazione

L’analyse exploratoire sert à explorer les données avec des méthodes statistiques et graphiques pour en comprendre la structure. Elle aide aussi à repérer les anomalies et les valeurs aberrantes.

Answer

Comprendre les variables, repérer les erreurs et les valeurs aberrantes

Question 12

12. Quel graphique est particulièrement utile pour visualiser la relation entre deux variables numériques ?

Le boxplot

L’histogramme

Le nuage de points

La matrice de confusion

Spiegazione

Le nuage de points est utilisé pour visualiser les relations entre deux variables numériques. Le boxplot et l’histogramme servent plutôt à décrire la distribution d’une variable.

Answer

Le nuage de points

Question 13

13. Que désigne la variable cible dans un modèle supervisé ?

La liste des hyperparamètres du modèle

La sortie que le modèle cherche à prédire

Le seuil de décision choisi après l’entraînement

Le nombre de variables explicatives

Spiegazione

La variable cible est la sortie à prédire par le modèle. Elle correspond au label en classification ou à la valeur numérique en régression.

Answer

La sortie que le modèle cherche à prédire

Question 14

14. Que représente une donnée catégorielle nominale ?

Une catégorie sans ordre, comme une couleur ou une marque

Une valeur numérique continue

Une catégorie avec ordre naturel

Une variable destinée à être prédite

Spiegazione

Une variable nominale décrit des groupes sans ordre, comme les couleurs ou les marques. Elle se distingue d’une variable ordinale, qui possède un ordre.

Answer

Une catégorie sans ordre, comme une couleur ou une marque

Question 15

15. Sur quel principe repose la méthode des k plus proches voisins ?

Sur une pénalisation des coefficients du modèle

Sur la moyenne de toutes les observations du jeu de données

Sur une séparation linéaire apprise par optimisation

Sur les k observations les plus proches dans l’espace des caractéristiques

Spiegazione

KNN prédit à partir des k observations les plus proches dans l’espace des caractéristiques. La décision dépend donc de la proximité mesurée entre points.

Answer

Sur les k observations les plus proches dans l’espace des caractéristiques

Question 16

16. En classification KNN, comment la prédiction finale est-elle généralement déterminée ?

Par la somme pondérée de tous les exemples

Par la médiane des valeurs des voisins

Par la classe majoritaire parmi les voisins

Par le coefficient le plus grand du modèle

Spiegazione

En classification KNN, la sortie est donnée par la classe majoritaire parmi les voisins. En régression, on utilise plutôt la moyenne des valeurs voisines.

Answer

Par la classe majoritaire parmi les voisins

Question 17

17. Quelle est la paire correcte de méthodes en Python pour entraîner puis prédire avec un modèle ?

fit() puis predict()

split() puis merge()

predict() puis fit()

transform() puis score()

Spiegazione

En Python, l’apprentissage se fait avec fit() et la prédiction avec predict(). C’est l’enchaînement standard pour entraîner puis utiliser un modèle.

Answer

fit() puis predict()

Question 18

18. Dans KNN, pourquoi dit-on que la méthode est non paramétrique ?

Parce qu’elle impose une fonction de coût quadratique

Parce qu’elle mémorise les observations de l’ensemble d’apprentissage

Parce qu’elle apprend uniquement des coefficients linéaires

Parce qu’elle n’utilise jamais de données d’entraînement

Spiegazione

KNN est non paramétrique car il mémorise les observations de l’ensemble d’apprentissage au lieu d’estimer une forme fonctionnelle fixe. La prédiction repose ensuite sur les voisins les plus proches.

Answer

Parce qu’elle mémorise les observations de l’ensemble d’apprentissage

Question 19

19. Pourquoi réalise-t-on un train-test split ?

Pour mesurer la performance sur des données jamais vues pendant l’entraînement

Pour entraîner et tester sur exactement les mêmes données

Pour augmenter artificiellement la taille du jeu de test

Pour supprimer les variables catégorielles du jeu de données

Spiegazione

Le train-test split permet d’évaluer la généralisation sur des données non vues pendant l’entraînement. Il aide ainsi à limiter une estimation trop optimiste due au surapprentissage.

Answer

Pour mesurer la performance sur des données jamais vues pendant l’entraînement

Question 20

20. Comment la prédiction finale d’une forêt aléatoire se fait-elle en régression ?

Par vote majoritaire

Par choix du plus petit arbre

Par la médiane des variables explicatives

Par moyenne des prédictions des arbres

Spiegazione

En régression, une forêt aléatoire agrège les arbres par moyenne des prédictions. En classification, l’agrégation se fait par vote majoritaire.

Answer

Par moyenne des prédictions des arbres

Question 21

21. Que minimise la méthode des moindres carrés ordinaires en régression linéaire ?

Le nombre de caractéristiques utilisées

L’erreur quadratique sur les données

La somme des erreurs absolues

La variance des variables explicatives

Spiegazione

Les moindres carrés ordinaires choisissent les paramètres en minimisant l’erreur quadratique. C’est le principe central de l’estimation en régression linéaire.

Answer

L’erreur quadratique sur les données

Question 22

22. Quelle forme prend le modèle de régression linéaire multiple ?

Une pénalité ajoutée aux coefficients

Une fonction de décision fondée sur des voisins

Une combinaison linéaire des caractéristiques plus un biais

Une somme de classes pondérées par des distances

Spiegazione

La régression linéaire multiple relie la cible à plusieurs caractéristiques par une combinaison linéaire avec un biais. Les coefficients sont ajustés pendant l’apprentissage.

Answer

Une combinaison linéaire des caractéristiques plus un biais

Question 23

23. Quelle est la particularité principale de la régularisation ridge ?

Elle remplace la régression par une classification

Elle ajoute une pénalité L2 pour limiter la taille des coefficients

Elle choisit uniquement les variables catégorielles

Elle peut forcer certains coefficients à zéro

Spiegazione

Ridge ajoute une pénalité L2 qui réduit l’amplitude des coefficients et aide à limiter le surapprentissage. Contrairement au lasso, elle ne vise pas à annuler explicitement certains coefficients.

Answer

Elle ajoute une pénalité L2 pour limiter la taille des coefficients

Question 24

24. Quel effet caractérise le lasso ?

Il pénalise les coefficients et peut en annuler certains exactement

Il transforme la régression en modèle non supervisé

Il impose une distance entre les observations

Il maximise la variance des prédictions

Spiegazione

Le lasso utilise une pénalité L1 qui peut pousser certains coefficients exactement à zéro. Il sert donc aussi à sélectionner des variables.

Answer

Il pénalise les coefficients et peut en annuler certains exactement

Quiz: Introduction au Machine Learning — 24 domande

Domande e risposte dettagliate

1. Comment définir le machine learning dans le cadre de l’intelligence artificielle ?

2. Dans quelles situations le machine learning est-il particulièrement adapté ?

3. Quelle est la première grande étape du processus de machine learning supervisé ?

4. À quoi sert principalement le jeu de test dans un processus de machine learning ?

5. Quel type d’apprentissage automatique consiste à prédire une sortie à partir de paires entrée/sortie connues ?

6. Quel type d’apprentissage vise à choisir des actions pour maximiser des récompenses au fil du temps ?

7. En apprentissage supervisé, que prédit un problème de classification ?

8. Que cherche à prédire un problème de régression ?

9. Qu’est-ce que le surapprentissage ?

10. Quel est l’intérêt principal de la validation croisée face à un seul découpage train-test ?

11. Quel est l’objectif principal de l’analyse exploratoire des données ?

12. Quel graphique est particulièrement utile pour visualiser la relation entre deux variables numériques ?

13. Que désigne la variable cible dans un modèle supervisé ?

14. Que représente une donnée catégorielle nominale ?

15. Sur quel principe repose la méthode des k plus proches voisins ?

16. En classification KNN, comment la prédiction finale est-elle généralement déterminée ?

17. Quelle est la paire correcte de méthodes en Python pour entraîner puis prédire avec un modèle ?

18. Dans KNN, pourquoi dit-on que la méthode est non paramétrique ?

19. Pourquoi réalise-t-on un train-test split ?

20. Comment la prédiction finale d’une forêt aléatoire se fait-elle en régression ?

21. Que minimise la méthode des moindres carrés ordinaires en régression linéaire ?

22. Quelle forme prend le modèle de régression linéaire multiple ?

23. Quelle est la particularité principale de la régularisation ridge ?

24. Quel effet caractérise le lasso ?

Ripassa con le flashcard

Studia la scheda di revisione

Similar courses

Parcours d’études numériques et commerce

Écosystème de l’esport et médiation numérique

Listes, piles, files et arbres

Algorithmique et structures de données

Gestion des fichiers en PHP

Identification utilisateur en PHP

Crea i tuoi quiz