📋 Plan du Cours
- Paysage de l’intelligence artificielle
- Niveaux d’intelligence artificielle
- IA par secteur et cas d’usage
- Machine Learning et types d’apprentissage
- Workflow Machine Learning de la donnée à la valeur
- Préparation des données et pipeline de prétraitement
- Réseaux de neurones : neurone artificiel et couches
- Rétropropagation et apprentissage du modèle
- Atelier pratique en Python sur données réelles
📖 1. Paysage de l’intelligence artificielle
🔑 Notions clés & Définitions
- Intelligence artificielle : Domaine technologique qui permet à des systèmes d’apprendre, d’interpréter et d’agir à partir de données ou d’entrées, pour accomplir des tâches cognitives.
- Machine Learning : Sous-domaine de l’IA où un modèle apprend des relations dans des données pour faire des prédictions ou des décisions sans programmer chaque règle manuellement.
- LLM : Modèle de langage de grande taille capable de traiter du texte et, dans le contexte du cours, de supporter aussi des modalités comme image et son.
- IA industrialisée : Phase où l’IA passe de tests ponctuels à des déploiements structurés, avec des usages stabilisés et une logique de production.
📝 Points essentiels
- Le cours présente l’IA comme un moteur de croissance, passé du stade d’expérimentation à l’industrialisation en 2026.
- Les LLM sont décrits comme suffisamment matures pour être exploités dans des cas d’usage concrets.
- La capacité multimodale est annoncée comme native, couvrant texte, image et son.
- Le ROI est chiffré : les entreprises rapportent +15 à 20% de productivité sur des tâches cognitives répétitives.
- Le risque d’inaction est formulé : ne pas intégrer l’IA expose à l’obsolescence face à des concurrents “IA-native”.
- Le taux d’adoption mentionné est de 42% des entreprises en 2026, avec une adoption mondiale mesurée en milliards de dollars.
💡 Astuce mémo
IA 2026 = Maturité (LLM) + Multimodal (texte/image/son) + Industrialisation + ROI (+15–20%) + Adoption (42%).
📖 2. Niveaux d’intelligence artificielle
🔑 Notions clés & Définitions
- IA faible : L’IA faible, aussi dite étroite, est spécialisée dans une tâche précise et performe mal hors de son domaine.
- IA forte : L’IA forte, aussi dite générale, vise une intelligence de niveau humain capable d’apprendre et de s’adapter à des tâches variées.
- Super-intelligence : La super-intelligence désigne une intelligence dépassant largement les meilleurs humains dans de nombreux domaines, avec un impact difficile à prévoir.
- ANI : ANI correspond à l’IA artificielle dite étroite, spécialisée et limitée à des compétences ciblées.
- AGI : AGI correspond à l’IA artificielle générale, conçue pour être polyvalente et transférer des capacités entre tâches.
📝 Points essentiels
- L’IA est classée selon sa capacité à reproduire les compétences humaines, de la spécialisation à la supériorité.
- L’IA faible est monotâche et spécialisée, sans conscience de soi, et dépend fortement des données disponibles.
- L’IA forte est décrite comme polyvalente, capable de raisonnement abstrait et d’adaptation au contexte.
- La super-intelligence est associée à une auto-amélioration rapide, une conscience supérieure et un impact imprévisible.
- Les niveaux d’IA servent à distinguer les attentes réalistes (spécialisation) des objectifs plus ambitieux (généralisation).
- Comparaison rapide : IA faible = tâche unique, IA forte = niveau humain polyvalent, super-intelligence = dépassement global et imprévisible.
💡 Astuce mémo
Faible = FOCUS (une tâche), Forte = FLEX (polyvalence), Super = SURPLUS (dépassement + imprévisible).
📖 3. IA par secteur et cas d’usage
🔑 Notions clés & Définitions
- Hyper-personnalisation : Technique d’IA qui adapte les messages et offres à chaque utilisateur à partir de ses données et comportements.
- Lead Scoring : Méthode d’IA qui attribue une note de probabilité à un prospect pour prioriser les leads les plus prometteurs.
- Maintenance prédictive : Approche d’IA qui anticipe les pannes à partir de signaux et historiques afin de planifier l’entretien.
- Chatbots intelligents : Système d’IA qui automatise le dialogue avec les clients pour répondre et orienter en continu.
- Analyse de sentiment : Traitement d’IA qui déduit l’émotion ou l’opinion exprimée dans un texte (avis, messages, commentaires).
📝 Points essentiels
- L’IA peut optimiser toute la chaîne de valeur via des décisions assistées ou automatisées, du marketing aux opérations.
- Marketing : l’IA sert l’hyper-personnalisation et le ciblage, notamment via recommandations et segmentation.
- Ventes : l’IA améliore l’efficacité commerciale grâce au lead scoring et à la priorisation des prospects.
- Finance : l’IA soutient la prévision de chiffre d’affaires et l’analyse de risques pour mieux anticiper les scénarios.
- Sécurité : l’IA détecte la fraude à partir de patterns et d’anomalies dans les données.
- Trading retail : l’IA aide à optimiser les points de vente et la gestion des stocks, y compris via pricing dynamique et réapprovisionnement automatisé.
💡 Astuce mémo
Marketing→Ventes→Finance→Sécurité→Retail→Opérations→Service : chaque flèche correspond à un cas d’usage typique (reco/segmentation, lead scoring, prévision CA/risques, fraude, pricing/stock, maintenance/logistique, chatbots/sentiment).
📖 4. Machine Learning et types d’apprentissage
🔑 Notions clés & Définitions
- Apprentissage supervisé : Approche où l’algorithme apprend à partir de données étiquetées pour prédire une sortie attendue à partir d’une entrée.
- Données étiquetées : Ensemble de données contenant, pour chaque entrée, une sortie attendue (label) permettant d’entraîner un modèle supervisé.
- Apprentissage non supervisé : Approche où l’algorithme apprend à partir de données brutes pour découvrir des structures, des groupes ou des anomalies sans sortie attendue.
- Apprentissage par renforcement : Approche où un agent apprend par essais-erreurs en interagissant avec un environnement pour maximiser une récompense.
- Régression : Tâche supervisée qui consiste à prédire une valeur numérique continue à partir de nouvelles données.
📝 Points essentiels
- En apprentissage supervisé, chaque exemple fournit une entrée X et une sortie attendue Y pour apprendre la prédiction.
- Les données étiquetées sont souvent coûteuses à préparer, ce qui limite parfois l’usage du supervisé.
- En apprentissage non supervisé, on utilise uniquement des entrées X pour explorer les données et trouver des structures cachées.
- En apprentissage par renforcement, l’agent choisit des actions séquentielles et reçoit des récompenses liées aux interactions avec l’environnement.
- Les objectifs typiques sont la prédiction (supervisé), l’exploration (non supervisé) et l’optimisation d’une récompense cumulée (renforcement).
- Exemples supervisés : prévision des ventes par régression, détection de churn par classification, scoring de crédit, filtrage spam.
💡 Astuce mémo
Supervisé = Corrigés (X→Y), Non supervisé = Sans corrigés (trouver des groupes), Renforcement = Récompenses (essais→meilleure stratégie).
📖 5. Workflow Machine Learning de la donnée à la valeur
🔑 Notions clés & Définitions
- SVM : SVM est un algorithme de classification qui cherche la meilleure frontière pour séparer des groupes de données.
- K-Means : K-Means est un algorithme de clustering qui regroupe des données similaires en plusieurs groupes.
- Réseaux de neurones : Les réseaux de neurones sont des modèles capables d’apprendre des relations complexes, notamment non linéaires.
- Pré-processing : Le pré-processing regroupe les opérations de nettoyage, transformation et structuration qui rendent les données exploitables par un modèle.
- Garbage In, Garbage Out : Garbage In, Garbage Out signifie que la qualité des prédictions dépend directement de la qualité des données d’entrée.
📝 Points essentiels
- La performance d’un modèle dépend fortement de la qualité des données préparées avant l’entraînement.
- Les données brutes contiennent souvent des valeurs manquantes, des doublons, du bruit (erreurs) et des valeurs aberrantes.
- Des formats hétérogènes (texte, chiffres, dates) doivent être harmonisés car le modèle ne peut pas les traiter tels quels.
- Des variables à des échelles très différentes peuvent biaiser l’apprentissage vers les grands nombres si aucune mise à l’échelle n’est faite.
- Le pipeline typique passe par collecte, import, nettoyage, transformation, encodage, puis découpage en entraînement et test.
- Le découpage proposé est 80% pour l’entraînement et 20% pour le test afin d’évaluer la généralisation.
💡 Astuce mémo
Qualité des données → qualité du modèle : Garbage In, Garbage Out.
📖 6. Préparation des données et pipeline de prétraitement
🔑 Notions clés & Définitions
- Pipeline de préparation des données : Pipeline de prétraitement : enchaînement d’étapes qui transforme des données brutes en entrées exploitables par les algorithmes.
- Normalisation 0-1 : Normalisation 0-1 : mise à l’échelle des variables pour les ramener entre 0 et 1.
- Standardisation : Standardisation : transformation qui recentre et met à l’échelle une variable pour la rendre comparable entre features.
- One-Hot Encoding : One-Hot Encoding : encodage qui remplace une catégorie par plusieurs variables binaires.
- Stratification du split : Stratification : découpage train/test qui conserve la même proportion de classes dans chaque sous-ensemble.
📝 Points essentiels
- La qualité du modèle dépend fortement des étapes de préparation des données, souvent présentées comme une grande partie du résultat final.
- Le pipeline typique inclut collecte, import (ex. Pandas), nettoyage (valeurs manquantes, doublons, valeurs aberrantes), puis transformations.
- La séparation train/test sert à apprendre, régler et évaluer sans réutiliser le test pendant l’ajustement.
- Un split courant est 80% pour l’entraînement et 20% pour le test, avec un jeu de test réservé à la fin.
- La stratification (stratify=y) garde la même répartition des classes (ex. 20% churners) dans train et test.
- Exemple scikit-learn : train_test_split(X, y, test_size=0.2, random_state=42, stratify=y) produit X_train, X_test, y_train, y_test.
💡 Astuce mémo
Qualité = “Garbage In, Garbage Out” : si les données sont sales ou mal encodées, le modèle hérite du problème.
📖 7. Réseaux de neurones : neurone artificiel et couches
🔑 Notions clés & Définitions
- Neurone artificiel : Un neurone artificiel est une fonction mathématique qui transforme des entrées numériques en une sortie via une somme pondérée puis une activation.
- Nœud (Node) : Un nœud est une unité de calcul qui agrège des entrées en effectuant une somme pondérée.
- Poids (Weight) : Un poids est un nombre qui mesure l’importance d’une connexion entre une entrée et un nœud.
- Biais : Le biais est un paramètre ajouté à la somme pondérée pour décaler la décision du neurone.
- Fonction d’activation : La fonction d’activation introduit une non-linéarité et décide si le neurone produit une sortie “activée” ou non.
📝 Points essentiels
- Le neurone artificiel reçoit des entrées numériques (ex: pixels, variables business) et ne “pense” pas directement sur du texte ou des catégories brutes.
- Le calcul interne suit une logique : multiplication entrée × poids, puis somme, puis ajout du biais.
- Les poids sont ajustés automatiquement pendant l’apprentissage pour améliorer les prédictions.
- La fonction d’activation transforme le résultat de la somme pondérée en sortie exploitable par le réseau.
- La sortie peut être une probabilité (ex: 85% pour une classe) ou une valeur continue (ex: prix).
- La couche d’entrée sert d’interface : elle transmet les features aux couches suivantes sans extraire de “features” abstraites.
💡 Astuce mémo
Entrées × poids → somme + biais → activation : “pondérer puis décider”.
📖 8. Rétropropagation et apprentissage du modèle
🔑 Notions clés & Définitions
- Rétropropagation : Procédure d’apprentissage qui propage l’erreur en sens inverse pour calculer comment ajuster les poids afin de réduire la perte.
- Forward pass : Étape où les données traversent le réseau pour produire une prédiction à partir des poids actuels.
- Loss function : Fonction qui mesure l’écart entre la prédiction du modèle et la réalité, servant de signal d’erreur.
- Gradient : Quantité indiquant dans quelle direction et à quel point les poids doivent changer pour diminuer la loss.
- Optimiseur : Méthode qui met à jour les poids à partir du gradient, par exemple SGD ou Adam.
📝 Points essentiels
- Le forward pass calcule une prédiction 2 à partir des données en faisant circuler l’information couche par couche.
- La loss compare la prédiction 2 à la réalité Y et fournit un score d’erreur utilisé pour guider l’apprentissage.
- La backpropagation attribue la responsabilité de l’erreur à chaque poids en calculant le gradient.
- L’ajustement des weights se fait en modifiant légèrement les poids pour réduire la loss lors des prochaines prédictions.
- Les optimizers comme SGD ou Adam déterminent la règle exacte de mise à jour des poids à partir du gradient.
💡 Astuce mémo
Forward = Avancer (prédire), Loss = Mesurer l’erreur, Backprop = Retourner (attribuer), Optimizer = Ajuster (réduire la loss).
📖 9. Atelier pratique en Python sur données réelles
🔑 Notions clés & Définitions
- Forward Pass : Mécanisme d’un réseau où l’entrée est transformée pour produire une prédiction avant toute mise à jour des paramètres.
- Loss Function : Fonction qui mesure l’écart entre la prédiction du modèle et la réalité, et sert de signal d’erreur pour l’apprentissage.
- Backpropagation : Procédure qui calcule comment chaque poids contribue à l’erreur afin de guider la mise à jour des paramètres.
- Optimizer : Algorithme qui applique une règle de mise à jour aux poids pour réduire la loss au fil des itérations.
- Google Colab : Notebook Jupyter hébergé dans le cloud, permettant d’exécuter du code Python sans installation locale et avec accès à un GPU.
📝 Points essentiels
- Le Forward Pass compare la prédiction Ŷ à la réalité Y pour produire une erreur via la Loss.
- La Backpropagation attribue la responsabilité de l’erreur à chaque poids grâce au calcul de gradient.
- L’Optimizer modifie légèrement les Weights à chaque itération pour diminuer l’erreur lors du prochain essai.
- Les optimizers cités sont SGD et Adam, utilisés pour piloter l’ajustement des poids.
- Google Colab est un notebook Jupyter dans le cloud, gratuit et nécessite un compte Google.
- Le GPU proposé peut être une NVIDIA T4, annoncée comme accélérant l’entraînement (10x à 50x).
💡 Astuce mémo
Forward Pass = Ŷ vs Y (Loss), Backprop = gradients, Optimizer = mise à jour des Weights; Colab = cloud + GPU T4.
📅 Repères chronologiques
| Date | Événement |
|---|
| 2026 | Vision 2026 : passage de l’expérimentation à l’industrialisation ; taux d’adoption des entreprises |
| Février 2026 | Intitulé de la formation (FORMATION 2026 Février 2026) |
| 2010+ | Repère chronologique : Deep Learning (dans la frise IA vs Machine Learning vs Deep Learning) |
📊 Tableaux de synthèse
IA vs Machine Learning vs Deep Learning
| Niveau | Définition | Repère |
|---|
| Intelligence Artificielle | Grand ensemble : toute technique qui permet aux ordinateurs de mimer l’intelligence humaine (logique, si-alors, règles). | 1950+ |
| Machine Learning | Sous-ensemble : algorithmes qui apprennent des données sans être explicitement programmés pour chaque règle. | 1980+ |
| Deep Learning | Cœur puissant : technique de ML inspirée des neurones, utilisant des couches multiples pour apprendre des motifs complexes. | 2010+ |
Types d’apprentissage (ML)
| Type | Données | Objectif |
|---|
| Supervisé | Données étiquetées (labels) : entrée + sortie attendue. | Prédiction (prédire une valeur ou une catégorie). |
| Non supervisé | Données brutes (uniquement entrées). | Exploration (découvrir des structures cachées ou des groupes). |
| Renforcement | États & récompenses via interactions agent/environnement. | Optimisation (maximiser une récompense cumulée). |
⚠️ Pièges & confusions fréquents
- Confondre IA faible/étroite et IA forte/générale : l’une est spécialisée et échoue hors domaine, l’autre vise une polyvalence de niveau humain.
- Croire que le modèle “comprend” directement le texte ou les catégories brutes : il ne travaille que sur des nombres (features encodées).
- Penser que le test sert à ajuster : le split train/test sert à apprendre, régler, puis évaluer une seule fois à la fin.
- Oublier que la qualité des données conditionne la performance : Garbage In, Garbage Out signifie que des valeurs manquantes, doublons ou échelles biaisent l’apprentissage.
- Mélanger forward pass et backprop : forward produit la prédiction, la loss mesure l’erreur, puis la rétroprop calcule le gradient pour ajuster les poids.
- Croire que “plus de couches” n’apporte rien : dans le cours, la profondeur augmente la capacité à combiner des motifs et construire des concepts plus complexes.
- Confondre les fonctions d’activation selon l’objectif business : sigmoid pour Oui/Non, softmax pour catégories, linéaire pour valeurs.
✅ Checklist Examen
- Identifier la définition simplifiée de l’IA et les 4 catégories (Perception, Raisonnement, Action, Apprentissage) avec un exemple pour chacune.
- Expliquer les 3 niveaux d’intelligence artificielle (ANI/IA faible, AGI/IA forte, ASI/super-intelligence) et leurs caractéristiques clés.
- Citer au moins 4 cas d’usage par secteur (Marketing, Ventes, Finance, Sécurité, Trading retail, Opérations, Service) et relier chaque secteur à l’usage.
- Distinguer IA, Machine Learning et Deep Learning via la logique “grand ensemble / sous-ensemble / cœur” et les repères 1950+, 1980+, 2010+.
- Décrire les 3 types d’apprentissage (supervisé, non supervisé, renforcement) en précisant le type de données et l’objectif (prédiction/exploration/optimisation).
- Donner un exemple business pour chaque type d’apprentissage (ex : régression ventes, segmentation clustering, pricing dynamique).
- Reconstituer le workflow ML simplifié en 4 étapes : collecte/import, clean & feature eng, train & eval, prod & monitoring.
- Expliquer pourquoi le pré-processing est crucial et ce que signifie Garbage In, Garbage Out avec les problèmes typiques (valeurs manquantes, doublons, bruit/outliers, échelles).
- Lister les étapes du pipeline de préparation : normalisation (0-1), standardisation, encodage (One-Hot), et split avec stratification (stratify=y).
- Savoir interpréter un split train/test : 80% entraînement, 20% test, et le rôle du test “réservé à la fin”.
- Décrire l’anatomie d’un neurone artificiel : somme pondérée, biais, fonction d’activation, et le fait que la sortie peut être probabilité ou valeur.
- Expliquer le cycle d’apprentissage par rétropropagation : forward pass, loss function, backpropagation (gradient), puis mise à jour par optimizer (SGD/Adam).
- Décrire le rôle des couches d’un réseau : couche d’entrée (features), couches cachées (abstraction/profondeur), couche de sortie (sigmoid/softmax/linéaire) et un exemple de sortie (ex : 85% risque churn).
- Présenter l’atelier pratique : Google Colab (cloud, compte Google, GPU T4) et le principe général du code (GPU disponible, exécution).
Create your own revision sheets
Import your course and AI generates sheets, quizzes and flashcards in 30 seconds.
Sheet generator