Revision Sheet: Introduction à l'Intelligence Artificielle et Machine Learning

Plan du Cours

Paysage de l’intelligence artificielle
Niveaux d’intelligence artificielle
IA par secteur et cas d’usage
Machine Learning et types d’apprentissage
Workflow Machine Learning de la donnée à la valeur
Préparation des données et pipeline de prétraitement
Réseaux de neurones : neurone artificiel et couches
Rétropropagation et apprentissage du modèle
Atelier pratique en Python sur données réelles

1. Paysage de l’intelligence artificielle

Notions clés & Définitions

Intelligence artificielle : Domaine technologique qui permet à des systèmes d’apprendre, d’interpréter et d’agir à partir de données ou d’entrées, pour accomplir des tâches cognitives.
Machine Learning : Sous-domaine de l’IA où un modèle apprend des relations dans des données pour faire des prédictions ou des décisions sans programmer chaque règle manuellement.
LLM : Modèle de langage de grande taille capable de traiter du texte et, dans le contexte du cours, de supporter aussi des modalités comme image et son.
IA industrialisée : Phase où l’IA passe de tests ponctuels à des déploiements structurés, avec des usages stabilisés et une logique de production.

Points essentiels

Le cours présente l’IA comme un moteur de croissance, passé du stade d’expérimentation à l’industrialisation en 2026.
Les LLM sont décrits comme suffisamment matures pour être exploités dans des cas d’usage concrets.
La capacité multimodale est annoncée comme native, couvrant texte, image et son.
Le ROI est chiffré : les entreprises rapportent +15 à 20% de productivité sur des tâches cognitives répétitives.
Le risque d’inaction est formulé : ne pas intégrer l’IA expose à l’obsolescence face à des concurrents “IA-native”.
Le taux d’adoption mentionné est de 42% des entreprises en 2026, avec une adoption mondiale mesurée en milliards de dollars.

Astuce mémo

IA 2026 = Maturité (LLM) + Multimodal (texte/image/son) + Industrialisation + ROI (+15–20%) + Adoption (42%).

2. Niveaux d’intelligence artificielle

Notions clés & Définitions

IA faible : L’IA faible, aussi dite étroite, est spécialisée dans une tâche précise et performe mal hors de son domaine.
IA forte : L’IA forte, aussi dite générale, vise une intelligence de niveau humain capable d’apprendre et de s’adapter à des tâches variées.
Super-intelligence : La super-intelligence désigne une intelligence dépassant largement les meilleurs humains dans de nombreux domaines, avec un impact difficile à prévoir.
ANI : ANI correspond à l’IA artificielle dite étroite, spécialisée et limitée à des compétences ciblées.
AGI : AGI correspond à l’IA artificielle générale, conçue pour être polyvalente et transférer des capacités entre tâches.

Points essentiels

L’IA est classée selon sa capacité à reproduire les compétences humaines, de la spécialisation à la supériorité.
L’IA faible est monotâche et spécialisée, sans conscience de soi, et dépend fortement des données disponibles.
L’IA forte est décrite comme polyvalente, capable de raisonnement abstrait et d’adaptation au contexte.
La super-intelligence est associée à une auto-amélioration rapide, une conscience supérieure et un impact imprévisible.
Les niveaux d’IA servent à distinguer les attentes réalistes (spécialisation) des objectifs plus ambitieux (généralisation).
Comparaison rapide : IA faible = tâche unique, IA forte = niveau humain polyvalent, super-intelligence = dépassement global et imprévisible.

Astuce mémo

Faible = FOCUS (une tâche), Forte = FLEX (polyvalence), Super = SURPLUS (dépassement + imprévisible).

3. IA par secteur et cas d’usage

Notions clés & Définitions

Hyper-personnalisation : Technique d’IA qui adapte les messages et offres à chaque utilisateur à partir de ses données et comportements.
Lead Scoring : Méthode d’IA qui attribue une note de probabilité à un prospect pour prioriser les leads les plus prometteurs.
Maintenance prédictive : Approche d’IA qui anticipe les pannes à partir de signaux et historiques afin de planifier l’entretien.
Chatbots intelligents : Système d’IA qui automatise le dialogue avec les clients pour répondre et orienter en continu.
Analyse de sentiment : Traitement d’IA qui déduit l’émotion ou l’opinion exprimée dans un texte (avis, messages, commentaires).

Points essentiels

L’IA peut optimiser toute la chaîne de valeur via des décisions assistées ou automatisées, du marketing aux opérations.
Marketing : l’IA sert l’hyper-personnalisation et le ciblage, notamment via recommandations et segmentation.
Ventes : l’IA améliore l’efficacité commerciale grâce au lead scoring et à la priorisation des prospects.
Finance : l’IA soutient la prévision de chiffre d’affaires et l’analyse de risques pour mieux anticiper les scénarios.
Sécurité : l’IA détecte la fraude à partir de patterns et d’anomalies dans les données.
Trading retail : l’IA aide à optimiser les points de vente et la gestion des stocks, y compris via pricing dynamique et réapprovisionnement automatisé.

Astuce mémo

Marketing→Ventes→Finance→Sécurité→Retail→Opérations→Service : chaque flèche correspond à un cas d’usage typique (reco/segmentation, lead scoring, prévision CA/risques, fraude, pricing/stock, maintenance/logistique, chatbots/sentiment).

4. Machine Learning et types d’apprentissage

Notions clés & Définitions

Apprentissage supervisé : Approche où l’algorithme apprend à partir de données étiquetées pour prédire une sortie attendue à partir d’une entrée.
Données étiquetées : Ensemble de données contenant, pour chaque entrée, une sortie attendue (label) permettant d’entraîner un modèle supervisé.
Apprentissage non supervisé : Approche où l’algorithme apprend à partir de données brutes pour découvrir des structures, des groupes ou des anomalies sans sortie attendue.
Apprentissage par renforcement : Approche où un agent apprend par essais-erreurs en interagissant avec un environnement pour maximiser une récompense.
Régression : Tâche supervisée qui consiste à prédire une valeur numérique continue à partir de nouvelles données.

Points essentiels

En apprentissage supervisé, chaque exemple fournit une entrée X et une sortie attendue Y pour apprendre la prédiction.
Les données étiquetées sont souvent coûteuses à préparer, ce qui limite parfois l’usage du supervisé.
En apprentissage non supervisé, on utilise uniquement des entrées X pour explorer les données et trouver des structures cachées.
En apprentissage par renforcement, l’agent choisit des actions séquentielles et reçoit des récompenses liées aux interactions avec l’environnement.
Les objectifs typiques sont la prédiction (supervisé), l’exploration (non supervisé) et l’optimisation d’une récompense cumulée (renforcement).
Exemples supervisés : prévision des ventes par régression, détection de churn par classification, scoring de crédit, filtrage spam.

Astuce mémo

Supervisé = Corrigés (X→Y), Non supervisé = Sans corrigés (trouver des groupes), Renforcement = Récompenses (essais→meilleure stratégie).

5. Workflow Machine Learning de la donnée à la valeur

Notions clés & Définitions

SVM : SVM est un algorithme de classification qui cherche la meilleure frontière pour séparer des groupes de données.
K-Means : K-Means est un algorithme de clustering qui regroupe des données similaires en plusieurs groupes.
Réseaux de neurones : Les réseaux de neurones sont des modèles capables d’apprendre des relations complexes, notamment non linéaires.
Pré-processing : Le pré-processing regroupe les opérations de nettoyage, transformation et structuration qui rendent les données exploitables par un modèle.
Garbage In, Garbage Out : Garbage In, Garbage Out signifie que la qualité des prédictions dépend directement de la qualité des données d’entrée.

Points essentiels

La performance d’un modèle dépend fortement de la qualité des données préparées avant l’entraînement.
Les données brutes contiennent souvent des valeurs manquantes, des doublons, du bruit (erreurs) et des valeurs aberrantes.
Des formats hétérogènes (texte, chiffres, dates) doivent être harmonisés car le modèle ne peut pas les traiter tels quels.
Des variables à des échelles très différentes peuvent biaiser l’apprentissage vers les grands nombres si aucune mise à l’échelle n’est faite.
Le pipeline typique passe par collecte, import, nettoyage, transformation, encodage, puis découpage en entraînement et test.
Le découpage proposé est 80% pour l’entraînement et 20% pour le test afin d’évaluer la généralisation.

Astuce mémo

Qualité des données → qualité du modèle : Garbage In, Garbage Out.

6. Préparation des données et pipeline de prétraitement

Notions clés & Définitions

Pipeline de préparation des données : Pipeline de prétraitement : enchaînement d’étapes qui transforme des données brutes en entrées exploitables par les algorithmes.
Normalisation 0-1 : Normalisation 0-1 : mise à l’échelle des variables pour les ramener entre 0 et 1.
Standardisation : Standardisation : transformation qui recentre et met à l’échelle une variable pour la rendre comparable entre features.
One-Hot Encoding : One-Hot Encoding : encodage qui remplace une catégorie par plusieurs variables binaires.
Stratification du split : Stratification : découpage train/test qui conserve la même proportion de classes dans chaque sous-ensemble.

Points essentiels

La qualité du modèle dépend fortement des étapes de préparation des données, souvent présentées comme une grande partie du résultat final.
Le pipeline typique inclut collecte, import (ex. Pandas), nettoyage (valeurs manquantes, doublons, valeurs aberrantes), puis transformations.
La séparation train/test sert à apprendre, régler et évaluer sans réutiliser le test pendant l’ajustement.
Un split courant est 80% pour l’entraînement et 20% pour le test, avec un jeu de test réservé à la fin.
La stratification (stratify=y) garde la même répartition des classes (ex. 20% churners) dans train et test.
Exemple scikit-learn : train_test_split(X, y, test_size=0.2, random_state=42, stratify=y) produit X_train, X_test, y_train, y_test.

Astuce mémo

Qualité = “Garbage In, Garbage Out” : si les données sont sales ou mal encodées, le modèle hérite du problème.

7. Réseaux de neurones : neurone artificiel et couches

Notions clés & Définitions

Neurone artificiel : Un neurone artificiel est une fonction mathématique qui transforme des entrées numériques en une sortie via une somme pondérée puis une activation.
Nœud (Node) : Un nœud est une unité de calcul qui agrège des entrées en effectuant une somme pondérée.
Poids (Weight) : Un poids est un nombre qui mesure l’importance d’une connexion entre une entrée et un nœud.
Biais : Le biais est un paramètre ajouté à la somme pondérée pour décaler la décision du neurone.
Fonction d’activation : La fonction d’activation introduit une non-linéarité et décide si le neurone produit une sortie “activée” ou non.

Points essentiels

Le neurone artificiel reçoit des entrées numériques (ex: pixels, variables business) et ne “pense” pas directement sur du texte ou des catégories brutes.
Le calcul interne suit une logique : multiplication entrée × poids, puis somme, puis ajout du biais.
Les poids sont ajustés automatiquement pendant l’apprentissage pour améliorer les prédictions.
La fonction d’activation transforme le résultat de la somme pondérée en sortie exploitable par le réseau.
La sortie peut être une probabilité (ex: 85% pour une classe) ou une valeur continue (ex: prix).
La couche d’entrée sert d’interface : elle transmet les features aux couches suivantes sans extraire de “features” abstraites.

Astuce mémo

Entrées × poids → somme + biais → activation : “pondérer puis décider”.

8. Rétropropagation et apprentissage du modèle

Notions clés & Définitions

Rétropropagation : Procédure d’apprentissage qui propage l’erreur en sens inverse pour calculer comment ajuster les poids afin de réduire la perte.
Forward pass : Étape où les données traversent le réseau pour produire une prédiction à partir des poids actuels.
Loss function : Fonction qui mesure l’écart entre la prédiction du modèle et la réalité, servant de signal d’erreur.
Gradient : Quantité indiquant dans quelle direction et à quel point les poids doivent changer pour diminuer la loss.
Optimiseur : Méthode qui met à jour les poids à partir du gradient, par exemple SGD ou Adam.

Points essentiels

Le forward pass calcule une prédiction $2$ à partir des données en faisant circuler l’information couche par couche.
La loss compare la prédiction $2$ à la réalité $Y$ et fournit un score d’erreur utilisé pour guider l’apprentissage.
La backpropagation attribue la responsabilité de l’erreur à chaque poids en calculant le gradient.
L’ajustement des weights se fait en modifiant légèrement les poids pour réduire la loss lors des prochaines prédictions.
Les optimizers comme SGD ou Adam déterminent la règle exacte de mise à jour des poids à partir du gradient.

Astuce mémo

Forward = Avancer (prédire), Loss = Mesurer l’erreur, Backprop = Retourner (attribuer), Optimizer = Ajuster (réduire la loss).

9. Atelier pratique en Python sur données réelles

Notions clés & Définitions

Forward Pass : Mécanisme d’un réseau où l’entrée est transformée pour produire une prédiction avant toute mise à jour des paramètres.
Loss Function : Fonction qui mesure l’écart entre la prédiction du modèle et la réalité, et sert de signal d’erreur pour l’apprentissage.
Backpropagation : Procédure qui calcule comment chaque poids contribue à l’erreur afin de guider la mise à jour des paramètres.
Optimizer : Algorithme qui applique une règle de mise à jour aux poids pour réduire la loss au fil des itérations.
Google Colab : Notebook Jupyter hébergé dans le cloud, permettant d’exécuter du code Python sans installation locale et avec accès à un GPU.

Points essentiels

Le Forward Pass compare la prédiction Ŷ à la réalité Y pour produire une erreur via la Loss.
La Backpropagation attribue la responsabilité de l’erreur à chaque poids grâce au calcul de gradient.
L’Optimizer modifie légèrement les Weights à chaque itération pour diminuer l’erreur lors du prochain essai.
Les optimizers cités sont SGD et Adam, utilisés pour piloter l’ajustement des poids.
Google Colab est un notebook Jupyter dans le cloud, gratuit et nécessite un compte Google.
Le GPU proposé peut être une NVIDIA T4, annoncée comme accélérant l’entraînement (10x à 50x).

Astuce mémo

Forward Pass = Ŷ vs Y (Loss), Backprop = gradients, Optimizer = mise à jour des Weights; Colab = cloud + GPU T4.

Repères chronologiques

Date	Événement
2026	Vision 2026 : passage de l’expérimentation à l’industrialisation ; taux d’adoption des entreprises
Février 2026	Intitulé de la formation (FORMATION 2026 Février 2026)
2010+	Repère chronologique : Deep Learning (dans la frise IA vs Machine Learning vs Deep Learning)

Tableaux de synthèse

IA vs Machine Learning vs Deep Learning

Niveau	Définition	Repère
Intelligence Artificielle	Grand ensemble : toute technique qui permet aux ordinateurs de mimer l’intelligence humaine (logique, si-alors, règles).	1950+
Machine Learning	Sous-ensemble : algorithmes qui apprennent des données sans être explicitement programmés pour chaque règle.	1980+
Deep Learning	Cœur puissant : technique de ML inspirée des neurones, utilisant des couches multiples pour apprendre des motifs complexes.	2010+

Types d’apprentissage (ML)

Type	Données	Objectif
Supervisé	Données étiquetées (labels) : entrée + sortie attendue.	Prédiction (prédire une valeur ou une catégorie).
Non supervisé	Données brutes (uniquement entrées).	Exploration (découvrir des structures cachées ou des groupes).
Renforcement	États & récompenses via interactions agent/environnement.	Optimisation (maximiser une récompense cumulée).

Pièges & confusions fréquents

Confondre IA faible/étroite et IA forte/générale : l’une est spécialisée et échoue hors domaine, l’autre vise une polyvalence de niveau humain.
Croire que le modèle “comprend” directement le texte ou les catégories brutes : il ne travaille que sur des nombres (features encodées).
Penser que le test sert à ajuster : le split train/test sert à apprendre, régler, puis évaluer une seule fois à la fin.
Oublier que la qualité des données conditionne la performance : Garbage In, Garbage Out signifie que des valeurs manquantes, doublons ou échelles biaisent l’apprentissage.
Mélanger forward pass et backprop : forward produit la prédiction, la loss mesure l’erreur, puis la rétroprop calcule le gradient pour ajuster les poids.
Croire que “plus de couches” n’apporte rien : dans le cours, la profondeur augmente la capacité à combiner des motifs et construire des concepts plus complexes.
Confondre les fonctions d’activation selon l’objectif business : sigmoid pour Oui/Non, softmax pour catégories, linéaire pour valeurs.

Checklist Examen

Identifier la définition simplifiée de l’IA et les 4 catégories (Perception, Raisonnement, Action, Apprentissage) avec un exemple pour chacune.
Expliquer les 3 niveaux d’intelligence artificielle (ANI/IA faible, AGI/IA forte, ASI/super-intelligence) et leurs caractéristiques clés.
Citer au moins 4 cas d’usage par secteur (Marketing, Ventes, Finance, Sécurité, Trading retail, Opérations, Service) et relier chaque secteur à l’usage.
Distinguer IA, Machine Learning et Deep Learning via la logique “grand ensemble / sous-ensemble / cœur” et les repères 1950+, 1980+, 2010+.
Décrire les 3 types d’apprentissage (supervisé, non supervisé, renforcement) en précisant le type de données et l’objectif (prédiction/exploration/optimisation).
Donner un exemple business pour chaque type d’apprentissage (ex : régression ventes, segmentation clustering, pricing dynamique).
Reconstituer le workflow ML simplifié en 4 étapes : collecte/import, clean & feature eng, train & eval, prod & monitoring.
Expliquer pourquoi le pré-processing est crucial et ce que signifie Garbage In, Garbage Out avec les problèmes typiques (valeurs manquantes, doublons, bruit/outliers, échelles).
Lister les étapes du pipeline de préparation : normalisation (0-1), standardisation, encodage (One-Hot), et split avec stratification (stratify=y).
Savoir interpréter un split train/test : 80% entraînement, 20% test, et le rôle du test “réservé à la fin”.
Décrire l’anatomie d’un neurone artificiel : somme pondérée, biais, fonction d’activation, et le fait que la sortie peut être probabilité ou valeur.
Expliquer le cycle d’apprentissage par rétropropagation : forward pass, loss function, backpropagation (gradient), puis mise à jour par optimizer (SGD/Adam).
Décrire le rôle des couches d’un réseau : couche d’entrée (features), couches cachées (abstraction/profondeur), couche de sortie (sigmoid/softmax/linéaire) et un exemple de sortie (ex : 85% risque churn).
Présenter l’atelier pratique : Google Colab (cloud, compte Google, GPU T4) et le principe général du code (GPU disponible, exécution).

📋 Plan du Cours

📖 1. Paysage de l’intelligence artificielle

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 2. Niveaux d’intelligence artificielle

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 3. IA par secteur et cas d’usage

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 4. Machine Learning et types d’apprentissage

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 5. Workflow Machine Learning de la donnée à la valeur

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 6. Préparation des données et pipeline de prétraitement

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 7. Réseaux de neurones : neurone artificiel et couches

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 8. Rétropropagation et apprentissage du modèle

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 9. Atelier pratique en Python sur données réelles

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📅 Repères chronologiques

📊 Tableaux de synthèse

IA vs Machine Learning vs Deep Learning

Types d’apprentissage (ML)

⚠️ Pièges & confusions fréquents

✅ Checklist Examen

Test your knowledge

Review with flashcards

Similar courses

Écosystème de l’esport et médiation numérique

Listes, piles, files et arbres

Algorithmique et structures de données

Gestion des fichiers en PHP

Identification utilisateur en PHP

Automated PCB Fault Diagnosis

Create your own revision sheets

Plan du Cours

1. Paysage de l’intelligence artificielle

Notions clés & Définitions

Points essentiels

Astuce mémo

2. Niveaux d’intelligence artificielle

Notions clés & Définitions

Points essentiels

Astuce mémo

3. IA par secteur et cas d’usage

Notions clés & Définitions

Points essentiels

Astuce mémo

4. Machine Learning et types d’apprentissage

Notions clés & Définitions

Points essentiels

Astuce mémo

5. Workflow Machine Learning de la donnée à la valeur

Notions clés & Définitions

Points essentiels

Astuce mémo

6. Préparation des données et pipeline de prétraitement

Notions clés & Définitions

Points essentiels

Astuce mémo

7. Réseaux de neurones : neurone artificiel et couches

Notions clés & Définitions

Points essentiels

Astuce mémo

8. Rétropropagation et apprentissage du modèle

Notions clés & Définitions

Points essentiels

Astuce mémo

9. Atelier pratique en Python sur données réelles

Notions clés & Définitions

Points essentiels

Astuce mémo

Repères chronologiques

Tableaux de synthèse

Pièges & confusions fréquents

Checklist Examen