Quiz: Introduction au Machine Learning et Types de Données — 14 Fragen

Detaillierte Fragen und Antworten

1. En apprentissage supervisé, sur quoi repose l’entraînement des algorithmes ?

Sur des données étiquetées avec une réponse attendue
Sur des données non organisées sans cible
Sur des données sans aucune indication de sortie
Sur des interactions avec récompense uniquement

Sur des données étiquetées avec une réponse attendue

Erklärung

L’apprentissage supervisé utilise des données labellisées, c’est-à-dire des exemples accompagnés de la réponse attendue. Cela permet au modèle d’apprendre à classer ou à prédire.

2. Qu’est-ce qui caractérise l’apprentissage non supervisé ?

L’utilisation exclusive de données labellisées pour entraîner le modèle
La prédiction d’une valeur quantitative continue à partir de variables explicatives
L’absence d’étiquettes dans les données utilisées pour apprendre des structures
La présence systématique de réponses attendues pour chaque exemple

L’absence d’étiquettes dans les données utilisées pour apprendre des structures

Erklärung

En apprentissage non supervisé, on ne dispose pas d’étiquettes et l’objectif est de découvrir des structures ou régularités dans les données. Les autres réponses décrivent l’apprentissage supervisé ou la régression.

3. Quelle affirmation décrit le mieux une donnée ?

Une règle d’organisation d’un tableau
Un résultat obtenu après mise en contexte
Une observation brute non analysée servant de matière première
Un message interprété donnant un sens complet

Une observation brute non analysée servant de matière première

Erklärung

Une donnée est une observation brute, sans interprétation préalable. L’information, au contraire, correspond au sens interprété de ces observations.

4. Lequel de ces exemples correspond à des données semi-structurées ?

Un fichier XML
Un tableau SQL
Un fichier CSV
Une feuille Excel

Un fichier XML

Erklärung

Le XML est un exemple de donnée semi-structurée, car il repose sur une structure avec balises et métadonnées. Les fichiers SQL, CSV et Excel sont plutôt des exemples de données structurées.

5. Quel exemple correspond à l’apprentissage semi supervisé ?

Améliorer une performance par essais et récompenses
Prédire une valeur numérique à partir d’un ensemble de variables
Apprendre uniquement à partir de données sans aucune structure
Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Utiliser à la fois des données avec étiquettes et des données sans étiquettes pendant l’entraînement

Erklärung

L’apprentissage semi supervisé combine des données étiquetées et non étiquetées lors de l’entraînement. Les autres propositions correspondent à d’autres familles du machine learning.

6. Quel est l’objectif principal d’une régression linéaire ?

Regrouper des observations sans utiliser de variable cible
Classer des données en deux classes à partir de labels
Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives
Attribuer une étiquette à chaque observation à partir de catégories

Trouver une relation linéaire entre une variable cible quantitative et des variables explicatives

Erklärung

La régression linéaire cherche à modéliser une relation linéaire pour prédire une variable cible quantitative. Les autres propositions décrivent plutôt la classification ou l’apprentissage non supervisé.

7. Quel énoncé distingue correctement classification et régression ?

La classification prédit une valeur continue, tandis que la régression donne une étiquette
Les deux ne peuvent fonctionner qu’avec des variables qualitatives
La classification attribue une catégorie, tandis que la régression estime une valeur numérique
Les deux cherchent uniquement à organiser des données en tableaux

La classification attribue une catégorie, tandis que la régression estime une valeur numérique

Erklärung

La classification sert à attribuer une classe ou une étiquette, alors que la régression vise une valeur quantitative. C’est la distinction fondamentale entre les deux problèmes.

8. Qu’est-ce qui caractérise des données structurées ?

Elles sont toujours du texte brut non organisé
Elles suivent un schéma prédéfini avec lignes et colonnes
Elles n’ont aucun format fixe ni modèle
Elles reposent uniquement sur des balises et des métadonnées

Elles suivent un schéma prédéfini avec lignes et colonnes

Erklärung

Les données structurées suivent un schéma prédéfini, souvent sous forme de tableaux. Cette organisation facilite la recherche et l’analyse.

9. Que cherche principalement à faire le machine learning ?

Remplacer toute forme de calcul par des règles fixes
Écrire des règles manuelles sans données d’exemple
Apprendre automatiquement des régularités à partir de grands ensembles de données
Transformer chaque donnée en information sans apprentissage

Apprendre automatiquement des régularités à partir de grands ensembles de données

Erklärung

Le machine learning est une branche de l’intelligence artificielle qui apprend des régularités à partir de données. Il ne repose pas sur des règles fixes programmées à l’avance.

10. Quel exemple illustre le mieux un problème de classification supervisée ?

Estimer un salaire selon les années d’expérience
Calculer une valeur continue à partir d’une mesure
Détecter si un message est un spam ou non
Prédire le prix d’une maison selon sa surface

Détecter si un message est un spam ou non

Erklärung

La classification attribue une étiquette à une donnée qualitative, comme spam ou non spam. Les autres propositions relèvent de la régression, car elles visent une valeur quantitative.

11. Comment peut-on définir un jeu de données ?

Un ensemble organisé de données liées entre elles
Une liste de valeurs sans aucun lien entre elles
Une seule observation isolée et interprétée
Un message déjà formulé à partir d’une analyse

Un ensemble organisé de données liées entre elles

Erklärung

Un jeu de données est un ensemble de données organisées et reliées entre elles. Ce n’est pas une simple donnée isolée ni un message déjà interprété.

12. Que prédit un problème de régression ?

Une étiquette de classe
Une balise structurée
Une réponse sans variable cible
Une valeur quantitative continue

Une valeur quantitative continue

Erklärung

La régression consiste à prédire une grandeur numérique continue. La classification, elle, vise une étiquette ou une catégorie.

13. Dans une régression linéaire, que représente le training set ?

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés
Un tableau de résultats déjà prédits par le modèle
Le jeu de données réservé uniquement à l’évaluation finale du modèle
Un ensemble de données sans aucune variable explicative

L’ensemble de données d’entraînement utilisé pour ajuster le modèle aux points observés

Erklärung

Le training set sert à entraîner et ajuster le modèle en le faisant coller aux points observés. Il ne correspond pas au test final ni à un ensemble de résultats déjà prédits.

14. Quel enchaînement correspond au cycle d’apprentissage en machine learning ?

Mise en contexte, puis interprétation, puis stockage
Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation
Création d’une règle fixe, puis suppression de l’erreur, puis prédiction
Évaluation d’abord, puis correction, puis importation des données

Apprentissage sur les données, calcul d’erreur, correction, optimisation puis évaluation

Erklärung

Le cycle comprend l’apprentissage sur les données d’entraînement, le calcul de l’erreur, la correction, l’optimisation et enfin l’évaluation. C’est un processus itératif.

Mit Karteikarten lernen

Merke dir die Antworten mit 14 Karteikarten zu Introduction au Machine Learning et Types de Données.

Données — définition ?

Observations brutes non analysées.

Information — définition ?

Sens interprété d’observations.

Observation brute — rôle ?

Fournir des valeurs sans organisation.

Karteikarten ansehen →

Lernzettel studieren

Lies den vollständigen Lernzettel zu Introduction au Machine Learning et Types de Données.

Lernzettel ansehen →

Similar courses

Erstelle deine eigenen Quizze

Importiere deinen Kurs und die KI erstellt in 30 Sekunden Quizze mit Korrekturen.

Quiz-Generator