Revision Sheet: Introduction aux Techniques d'Apprentissage Automatique

Plan du Cours

Introduction à l'IA
Apprentissage automatique
Types d'apprentissage
Apprentissage supervisé
Apprentissage non supervisé
Méthodes de clustering
Arbres de décision
Méthriques et performances
Réseaux de neurones

1. Introduction à l'IA

Notions clés & Définitions

Intelligence Artificielle (IA)
AUTEUR inconnu (date non précisée) : discipline visant à créer des systèmes capables de résoudre des problèmes complexes difficiles pour l’humain, mais pas triviaux ou intuitifs.

Machine Learning
F. BOUSEFSAF (2023) : branche de l’IA permettant aux machines d’apprendre à partir d’exemples ou d’expériences sans programmation explicite, en ajustant leurs paramètres internes pour accomplir des tâches spécifiques.

Données
F. BOUSEFSAF (2023) : ensemble d’informations variées utilisées pour entraîner ou faire fonctionner des algorithmes d’IA, pouvant prendre plusieurs formes : numériques, texte, images, vidéos, réseaux, etc.

Caractéristiques (features)
F. BOUSEFSAF (2023) : motifs ou traits extraits des données, calculés en amont par des scientifiques, qui permettent de valoriser des patterns pour améliorer la performance des modèles.

Historique de l'IA
F. BOUSEFSAF (2023) : évolution de la discipline depuis ses origines, notamment avec la notion de machine intelligente introduite dès 1842, et son développement à travers diverses applications et techniques.

Points essentiels

L'IA vise à résoudre des problèmes complexes difficiles pour l’humain, en s’appuyant sur des méthodes variées. Le Machine Learning permet aux machines d’apprendre à partir d’exemples, sans être explicitement programmées, en ajustant leurs paramètres internes pour accomplir des tâches précises. Les données utilisées peuvent être très diverses : numériques, texte, images, vidéos, réseaux, etc.

À retenir

L’IA est une discipline interdisciplinaire centrée sur l’apprentissage à partir de données variées pour résoudre des problèmes complexes, en s’appuyant notamment sur le Machine Learning et l’analyse de caractéristiques.

2. Apprentissage automatique

Notions clés & Définitions

Phase d'apprentissage
Processus par lequel un modèle ajuste ses paramètres internes pour mieux représenter ou classifier les données. Il s'agit d'une étape où le modèle apprend à reconnaître des motifs ou des structures dans les données d'entrée pour produire des sorties attendues.

Paramètres internes
Variables ajustables d’un modèle d’apprentissage automatique, permettant de regrouper ou de classifier les données. Leur modification lors de la phase d'apprentissage permet d’optimiser la performance du modèle.

Science multidisciplinaire
L'apprentissage automatique combine plusieurs disciplines telles que la statistique, l’informatique, les mathématiques et la vision par ordinateur pour développer des méthodes permettant d’apprendre à partir des données.

Apprentissage à partir d'exemples
Méthode d'apprentissage où le modèle se construit en se basant sur des exemples concrets, en établissant une corrélation entre caractéristiques (données d’entrée) et sorties attendues (résultats ou étiquettes).

Points essentiels

Le programme d'apprentissage ajuste ses paramètres internes pour regrouper ou classifier les données, ce qui lui permet de reconnaître des motifs ou des structures pertinentes. L'apprentissage automatique est une discipline qui intègre des connaissances issues de plusieurs domaines, notamment la statistique, l’informatique, les mathématiques et la vision par ordinateur, afin de développer des modèles capables d'apprendre à partir d'exemples. Ce processus repose sur la corrélation entre caractéristiques des données et leurs sorties attendues, permettant au modèle d’identifier des motifs significatifs dans les données brutes.

À retenir

L'apprentissage automatique consiste à ajuster ses paramètres internes à partir d'exemples pour extraire des motifs pertinents, en combinant plusieurs disciplines pour optimiser la reconnaissance et la classification des données.

3. Types d'apprentissage

Notions clés & Définitions

Apprentissage supervisé
AUTEUR (date) : utilise des données annotées pour apprendre une fonction de prédiction. L’objectif est de modéliser la relation entre des entrées et des sorties étiquetées, afin de pouvoir prédire des valeurs pour de nouvelles données.

Apprentissage non supervisé
AUTEUR (date) : regroupe des données sans annotations pour découvrir des structures cachées. Il s’agit d’identifier des regroupements ou des caractéristiques intrinsèques des données sans référence à des étiquettes.

Apprentissage par renforcement
AUTEUR (date) : optimise une récompense à partir d’expériences successives. Le système apprend en interagissant avec un environnement, en maximisant une fonction de récompense à chaque étape.

Annotation des données
AUTEUR (date) : processus d’attribution d’étiquettes ou de métadonnées à des données brutes pour permettre leur utilisation dans des méthodes supervisées. Elle consiste à associer des informations pertinentes à chaque donnée.

Points essentiels

L'apprentissage supervisé utilise des données annotées pour apprendre une fonction de prédiction. Il se base sur un ensemble d’entraînement où chaque donnée est accompagnée d’une étiquette ou d’une sortie attendue. Après l’entraînement, le modèle est testé sur de nouvelles données pour évaluer ses performances.

L'apprentissage non supervisé regroupe des données sans annotations pour découvrir des structures cachées. La méthode consiste à analyser la distribution ou la proximité des données pour identifier des regroupements ou des patterns, comme dans le clustering.

L'apprentissage par renforcement optimise une récompense à partir d’expériences successives. Le système apprend par essais et erreurs, en ajustant ses actions pour maximiser la récompense cumulée sur le long terme.

À retenir

Les trois modes fondamentaux d'apprentissage se différencient principalement par la disponibilité et le type de données : supervisé avec données annotées, non supervisé avec données non étiquetées, et par renforcement basé sur la maximisation d’une récompense à partir d’expériences.

4. Apprentissage supervisé

Notions clés & Définitions

Classification

AUTEUR : voir section 3

Régression
AUTEUR (date) : technique où le modèle prédit une valeur continue pour une nouvelle observation à partir de données d’entraînement étiquetées. La sortie n’est pas une classe, mais une valeur numérique.

Validation croisée (k-fold)
AUTEUR (date) : méthode d’évaluation de la performance d’un modèle en divisant l’ensemble de données en k sous-ensembles. Le modèle est entraîné sur k-1 sous-ensembles et testé sur le sous-ensemble restant, répété k fois pour obtenir une estimation fiable.

Base d'entraînement, validation et test
AUTEUR (date) : ensemble de données utilisé pour entraîner le modèle (entraînement), pour ajuster ses paramètres ou choisir le meilleur modèle (validation), et pour évaluer sa performance finale sur des données inédites (test).

Points essentiels

Le modèle est entraîné sur des données étiquetées, c’est-à-dire annotées avec leur classe ou valeur cible. Ensuite, il est évalué sur des données nouvelles, non utilisées lors de l’entraînement, pour mesurer sa capacité à généraliser. La validation croisée, notamment la méthode k-fold, permet de sélectionner le modèle avec les meilleures performances en utilisant une procédure de division et de rotation des données. Cependant, l’obtention de données étiquetées peut être coûteuse et longue, car chaque observation doit être annotée avec précision.

À retenir

L’apprentissage supervisé repose sur un processus rigoureux d’entraînement sur des données étiquetées, suivi d’une validation pour garantir la capacité de généralisation du modèle. La validation croisée est essentielle pour optimiser la sélection du modèle, malgré le coût élevé de l’annotation des données.

5. Apprentissage non supervisé

Notions clés & Définitions

Clustering
Le clustering regroupe des données similaires sans annotations ou labels. Il s’agit d’identifier des groupes naturels dans un ensemble de données, en se basant uniquement sur leur proximité ou leur similarité intrinsèque.

Partitionnement hiérarchique
Le partitionnement hiérarchique construit des clusters de manière itérative, en fusionnant ou en divisant successivement des groupes. Il crée une structure arborescente appelée dendrogramme, permettant de visualiser la hiérarchie des regroupements.

Partitionnement non hiérarchique
Le partitionnement non hiérarchique, comme l’algorithme k-means, nécessite de connaître à l’avance le nombre de clusters à former. Il répartit les données en groupes en minimisant la variance intra-cluster, sans construire de hiérarchie.

Dendrogramme
Le dendrogramme est une représentation graphique de la hiérarchie de clusters dans le partitionnement hiérarchique. Il montre comment les groupes sont fusionnés ou divisés à chaque étape, permettant de visualiser la structure de regroupement.

Points essentiels

Le clustering regroupe des données similaires sans annotations, révélant ainsi la structure intrinsèque des données. Le partitionnement hiérarchique construit des clusters par fusion ou division successives, en utilisant une approche top-down ou bottom-up, et produit un dendrogramme pour visualiser cette hiérarchie. En revanche, le partitionnement non hiérarchique, comme l’exemple du k-means, nécessite de définir le nombre de clusters à l’avance, puis répartit les données pour minimiser la variance intra-cluster. Ces méthodes permettent toutes d’explorer la structure des données sans supervision, en découvrant des regroupements naturels.

À retenir

L’apprentissage non supervisé permet de révéler la structure intrinsèque des données en regroupant celles qui se ressemblent, sans utiliser d’étiquettes ou annotations, grâce à des méthodes hiérarchiques ou non hiérarchiques.

6. Méthodes de clustering

Notions clés & Définitions

k-means
k-means est un algorithme de clustering qui minimise la distance intra-cluster en assignant chaque point au barycentre (centre de gravité) du cluster auquel il appartient. Il s'agit d'une méthode d'optimisation visant à regrouper les données en k groupes en réduisant la variance à l’intérieur de chaque cluster.

k-means++
k-means++ est une méthode d'initialisation améliorée pour l'algorithme k-means. Elle consiste à choisir les centres initiaux de manière probabiliste, en favorisant la sélection de points éloignés, afin d’éviter les minima locaux et d’améliorer la convergence vers une solution optimale.

Fonctions de lien (linkage)
Les fonctions de lien définissent la distance entre deux clusters dans le cadre du clustering hiérarchique. Elles déterminent comment la distance entre clusters est calculée, influençant la structure finale du dendrogramme. Ces fonctions permettent de mesurer la proximité entre groupes en utilisant différentes stratégies (ex : liaison simple, liaison complète, moyenne).

Distance euclidienne
La distance euclidienne est une métrique qui mesure la longueur du segment reliant deux points dans un espace Euclidien. Elle est couramment utilisée pour calculer la proximité entre points ou centres de clusters, en étant la racine carrée de la somme des carrés des différences de chaque dimension.

Minimum local
Un minimum local désigne un point de l’espace de recherche où la fonction objectif atteint une valeur minimale, mais qui n’est pas la valeur globale la plus basse. En clustering, cela signifie que l’algorithme peut converger vers une solution sous-optimale, ce qui rend l’initialisation et la méthode d’optimisation cruciales.

Points essentiels

k-means minimise la distance intra-cluster en assignant chaque point à son barycentre, c’est-à-dire le centre moyen de ses membres. Cette méthode cherche à optimiser la cohésion des groupes en réduisant la variance interne, ce qui permet d’obtenir des clusters compacts.

L’initialisation joue un rôle crucial dans la performance de k-means. Une mauvaise sélection des centres initiaux peut conduire à un minimum local, empêchant l’algorithme d’atteindre la solution globale optimale. k-means++ améliore cette étape en choisissant les centres initiaux de façon probabiliste, en favorisant la dispersion des points de départ pour éviter ces minima locaux.

Les fonctions de lien dans le clustering hiérarchique déterminent la façon dont la distance entre deux clusters est calculée. Elles influencent la structure finale du regroupement en définissant la proximité entre groupes, ce qui est essentiel pour la construction d’un dendrogramme cohérent.

La distance euclidienne est la métrique la plus couramment utilisée pour mesurer la proximité dans ces algorithmes. Elle calcule la racine carrée de la somme des carrés des différences entre les coordonnées de deux points, ce qui correspond à la distance "à vol d’oiseau" dans l’espace.

Le minimum local représente une solution sous-optimale atteinte par l’algorithme, qui peut être évitée ou atténuée par une meilleure initialisation ou par des méthodes d’optimisation plus robustes, afin d’assurer une meilleure qualité de clustering.

À retenir

Comprendre les algorithmes de clustering comme des méthodes d’optimisation basées sur la distance et la structure des données permet d’améliorer leur efficacité et leur fiabilité, notamment en choisissant judicieusement l’initialisation et la métrique de proximité.

7. Arbres de décision

Notions clés & Définitions

Arbre de classification
Structure hiérarchique composée de nœuds internes et de feuilles, permettant de classer des données en effectuant une série de tests conditionnels sur les attributs. Chaque nœud interne représente un test sur un attribut, et chaque branche correspond à une réponse possible. La classification finale est donnée par la feuille atteinte.

Arbre de régression
Type d’arbre de décision destiné à prédire une valeur continue plutôt qu’une classe, en décomposant la tâche en tests successifs sur les attributs, jusqu’à atteindre une feuille qui fournit la valeur prédite.

Nœud interne
Noeud non terminal dans un arbre de décision, où se déroule un test conditionnel sur un attribut. Il sert à diviser les données en fonction des résultats du test, orientant vers d’autres nœuds ou feuilles.

Feuille
Noeud terminal d’un arbre de décision, correspondant à une classe ou une valeur prédite. Elle indique le résultat final après une série de tests hiérarchiques.

Test conditionnel
Opération effectuée dans un nœud interne pour décider du chemin à suivre. Il consiste à vérifier une condition sur un attribut (discret ou continu), permettant de diriger vers la branche appropriée.

Points essentiels

Les arbres hiérarchisent les décisions par une série de tests sur les attributs, ce qui permet une décomposition claire et structurée du processus de classification ou de régression. Ils peuvent gérer des données discrètes, en effectuant des tests sur des valeurs spécifiques, ainsi que des classes multimodales, en séparant efficacement plusieurs groupes ou catégories. Chaque feuille de l’arbre correspond à une classe ou une valeur prédite, fournissant une réponse précise à la fin du processus de décision.

À retenir

Les arbres de décision sont des modèles hiérarchiques qui décomposent la classification ou la régression en tests successifs, permettant une visualisation claire et une gestion efficace des données discrètes et multimodales.

8. Métriques et performances

Notions clés & Définitions

Fonction de coût (loss)
AUCUN contenu spécifique dans la source.

Descente de gradient
AUCUN contenu spécifique dans la source.

Régularisation
AUCUN contenu spécifique dans la source.

Erreur de surapprentissage
AUCUN contenu spécifique dans la source.

Points essentiels

La fonction de coût (loss) mesure l'écart entre les prédictions du modèle et les valeurs réelles, et son objectif est d'être minimisée pour améliorer la performance.
Dans le cas d’une régression, la métrique utilisée est le Mean Square Error (MSE), défini par :
$MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
Son racine carrée, Root MSE (RMSE), est souvent utilisée pour une interprétation plus intuitive.

Pour la classification, la performance se mesure par des métriques telles que la précision, le rappel et la F1-score, qui s’appuient sur la matrice de confusion :

Vrai positif (VP)
Faux positif (FP)
Faux négatif (FN)
Vrai négatif (VN)

La précision (p) est le rapport VP / (VP + FP), et le rappel (r) est VP / (VP + FN). La F1-score est la moyenne harmonique de la précision et du rappel :
$F1 = 2 \times \frac{p \times r}{p + r}$

Les performances du modèle peuvent aussi être affectées par le sous-apprentissage (imprécision, modèle trop simple) ou le surapprentissage (modèle trop ajusté, incapable de généraliser).

À retenir

L’optimisation des modèles repose sur la minimisation d’une fonction de coût, telle que le MSE pour la régression, tandis que la régularisation limite la complexité du modèle pour éviter le surapprentissage, garantissant ainsi une meilleure généralisation.

9. Réseaux de neurones

Notions clés & Définitions

Réseaux de neurones artificiels

AUTEUR : voir section 3

Paramètres internes ajustables
AUTEUR (date) : valeurs modifiables à l’intérieur du réseau, telles que les poids et biais, qui déterminent la réponse du réseau face à une donnée d’entrée.

Apprentissage par rétropropagation
AUTEUR (date) : algorithme permettant d’entraîner un réseau en comparant ses prédictions à la vérité, puis en ajustant les paramètres internes pour réduire l’erreur, via un processus de propagation de l’erreur en arrière dans le réseau.

Modèles non linéaires
AUTEUR (date) : modèles capables de représenter des relations complexes entre données et sorties, qui ne peuvent pas être décrites par des fonctions linéaires simples, grâce à l’utilisation de fonctions d’activation non linéaires.

Points essentiels

Les réseaux de neurones modélisent des relations complexes non linéaires entre données et sorties, permettant de traiter des problèmes difficiles comme la reconnaissance d’images ou de voix.
Ils ajustent leurs paramètres internes, notamment les poids et biais, en utilisant des algorithmes d’apprentissage tels que la rétropropagation.
Ils sont employés dans divers domaines, notamment la vision par ordinateur et la reconnaissance vocale, pour leur capacité à apprendre des représentations riches et variées.

À retenir

Les réseaux de neurones sont des modèles puissants capables d’apprendre des représentations complexes en ajustant itérativement leurs paramètres internes via la rétropropagation, ce qui leur confère une grande flexibilité dans la résolution de problèmes non linéaires.

Tableaux de Synthèse

Critère	Apprentissage Supervisé	Apprentissage Non Supervisé
Données	Annotées (étiquetées)	Non annotées (non étiquetées)
Objectif	Prédire une sortie ou une classe	Découvrir des structures ou regroupements
Méthodes principales	Classification, régression	Clustering, réduction de dimension
Évaluation	Validation croisée, précision, rappel	Indices de cohésion, silhouette
Exemple	Reconnaissance d’image, prédiction de prix	Segmentation d’images, analyse de similarités

Auteur / Concept	Notion clé
F. BOUSEFSAF (2023)	Machine Learning : apprentissage à partir d’exemples
F. BOUSEFSAF (2023)	Caractéristiques (features) : traits extraits des données

Pièges & Confusions Fréquentes

Confondre apprentissage supervisé et non supervisé : le premier nécessite des données étiquetées, le second non.
Sous-estimer l’importance de la validation croisée pour éviter le surapprentissage.
Confondre clustering et classification : le clustering ne nécessite pas d’étiquettes.
Oublier que la collecte de données annotées est coûteuse et longue.
Mal interpréter les résultats d’un algorithme de clustering comme étant une classification.
Négliger la nécessité de choisir le bon nombre de clusters dans le clustering.
Confondre réduction de dimension et clustering, bien que souvent liés.

Checklist Examen

Connaître la définition de l’Intelligence Artificielle selon la discipline visant à résoudre des problèmes complexes.
Maîtriser la notion de Machine Learning comme branche de l’IA permettant l’apprentissage à partir d’exemples.
Savoir que les données utilisées en IA peuvent être numériques, texte, images, vidéos ou réseaux.
Comprendre que les caractéristiques (features) sont des motifs extraits des données pour améliorer la performance des modèles.
Connaître l’évolution historique de l’IA depuis la machine intelligente introduite en 1842.
Expliquer que l’apprentissage automatique ajuste ses paramètres internes pour reconnaître des motifs dans les données.
Définir l’apprentissage supervisé comme utilisant des données annotées pour modéliser une relation entrée-sortie.
Distinguer l’apprentissage non supervisé comme découvrant des structures cachées sans annotations.
Définir l’apprentissage par renforcement comme optimisant une récompense via interaction avec un environnement.
Connaître la différence entre classification et régression dans le cadre de l’apprentissage supervisé.
Expliquer le rôle de la validation croisée (k-fold) dans l’évaluation et la sélection des modèles.
Savoir que l’apprentissage non supervisé inclut des méthodes comme le clustering et la réduction de dimension.

📋 Plan du Cours

📖 1. Introduction à l'IA

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 2. Apprentissage automatique

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 3. Types d'apprentissage

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 4. Apprentissage supervisé

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 5. Apprentissage non supervisé

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 6. Méthodes de clustering

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 7. Arbres de décision

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 8. Métriques et performances

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 9. Réseaux de neurones

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📊 Tableaux de Synthèse

⚠️ Pièges & Confusions Fréquentes

✅ Checklist Examen

Test your knowledge

Review with flashcards

Similar courses

Parcours d’études numériques et commerce

Écosystème de l’esport et médiation numérique

Listes, piles, files et arbres

Algorithmique et structures de données

Gestion des fichiers en PHP

Identification utilisateur en PHP

Create your own revision sheets

Plan du Cours

1. Introduction à l'IA

Notions clés & Définitions

Points essentiels

À retenir

2. Apprentissage automatique

Notions clés & Définitions

Points essentiels

À retenir

3. Types d'apprentissage

Notions clés & Définitions

Points essentiels

À retenir

4. Apprentissage supervisé

Notions clés & Définitions

Points essentiels

À retenir

5. Apprentissage non supervisé

Notions clés & Définitions

Points essentiels

À retenir

6. Méthodes de clustering

Notions clés & Définitions

Points essentiels

À retenir

7. Arbres de décision

Notions clés & Définitions

Points essentiels

À retenir

8. Métriques et performances

Notions clés & Définitions

Points essentiels

À retenir

9. Réseaux de neurones

Notions clés & Définitions

Points essentiels

À retenir

Tableaux de Synthèse

Pièges & Confusions Fréquentes

Checklist Examen