Лист за преговор: Introduction à l'Intelligence Artificielle et ses Enjeux

📋 Plan du Cours

  1. Définition de l’intelligence artificielle
  2. IA, Machine Learning et Deep Learning
  3. Rôle central des données
  4. Cycle d’un projet Machine Learning
  5. Apprentissage supervisé
  6. Classification et régression
  7. Apprentissage non supervisé
  8. Deep Learning et réseaux neuronaux
  9. GPU et modèles de langage
  10. Limites, biais et enjeux

📖 1. Définition de l’intelligence artificielle

🔑 Notions clés & Définitions

  • Intelligence Artificielle : L’intelligence artificielle regroupe des technologies qui permettent à une machine d’exécuter des tâches habituellement liées à des capacités humaines comme apprendre et raisonner.
  • Tâches nécessitant des capacités humaines : Les tâches visées par l’IA correspondent à des actions comme comprendre, reconnaître des formes, décider ou résoudre des problèmes.
  • Domaine plutôt que technologie unique : Le terme IA désigne un ensemble de méthodes variées plutôt qu’un seul outil ou une seule technologie.

📝 Points essentiels

  • L’IA vise à améliorer, assister ou automatiser des tâches réalisées auparavant uniquement par des humains.
  • Un système IA peut recommander du contenu en comparant les comportements observés à ceux d’autres utilisateurs, comme le fait Netflix.
  • Google Maps ne se limite pas à la distance : il prend aussi en compte trafic, accidents, travaux, vitesse moyenne, historique local et événements locaux.

💡 Astuce mémo

IA = ensemble d’approches pour imiter des capacités humaines (apprendre, raisonner, décider).

📖 2. IA, Machine Learning et Deep Learning

🔑 Notions clés & Définitions

  • IA : L’IA est le domaine global qui regroupe plusieurs approches pour reproduire ou automatiser des capacités humaines.
  • Machine Learning : Le machine learning est une branche de l’IA où les systèmes apprennent automatiquement à partir de données plutôt que via des règles explicitement codées.
  • Deep Learning : Le deep learning est une branche du machine learning qui s’appuie sur des réseaux neuronaux profonds pour apprendre.
  • Voiture autonome : L’exemple de voiture autonome illustre une chaîne allant de la décision IA au rôle du machine learning puis du deep learning pour la perception.

📝 Points essentiels

  • L’IA englobe le machine learning et le machine learning englobe le deep learning.
  • Avec des règles “si condition alors action”, la programmation classique devient difficile quand le problème dépend de nombreuses variables.
  • Pour la voiture autonome, l’apprentissage à partir de millions de kilomètres correspond au machine learning, tandis que la reconnaissance d’images correspond généralement au deep learning.
  • Pour le déverrouillage facial, apprendre depuis des photos relève du machine learning et analyser le visage via réseaux neuronaux relève du deep learning.

💡 Astuce mémo

IA > ML > Deep Learning (emboîtement des périmètres).

📖 3. Rôle central des données

🔑 Notions clés & Définitions

  • Données : Les données sont la matière première qui permet aux systèmes d’apprentissage de produire des prédictions utiles.
  • Big Data : Le big data désigne des contextes où la donnée constitue une ressource centrale pour alimenter des systèmes intelligents.
  • Garbage In, Garbage Out : L’expression “garbage in, garbage out” résume que des entrées de mauvaise qualité entraînent des sorties de mauvaise qualité.
  • Données de qualité : Des données de qualité correspondent à des données fiables et bien étiquetées, permettant un apprentissage correct.

📝 Points essentiels

  • Sans données, il n’y a pas d’apprentissage ; avec des données de mauvaise qualité, l’apprentissage produit des résultats mauvais.
  • Des radios floues et des images mal étiquetées peuvent amener un modèle médical à apprendre incorrectement la détection de fractures.
  • Pour prédire le départ de clients, des historiques incomplets, des doublons et des informations erronées dégradent les prédictions.
  • La qualité des données est souvent plus déterminante que le choix du modèle.

💡 Astuce mémo

Qualité des données > choix du modèle : si l’entrée est mauvaise, la sortie l’est aussi.

📖 4. Cycle d’un projet Machine Learning

🔑 Notions clés & Définitions

  • Collecte des données : La collecte des données consiste à réunir les informations nécessaires pour entraîner puis utiliser un modèle.
  • Nettoyage des données : Le nettoyage vise à corriger des problèmes de données comme erreurs, doublons ou valeurs manquantes.
  • Entraînement : L’entraînement correspond à la phase où le modèle observe de nombreux exemples pour apprendre des relations.
  • Test : Le test évalue le modèle sur des données jamais vues pendant l’entraînement pour mesurer sa généralisation.
  • Déploiement : Le déploiement correspond à l’usage du modèle dans un environnement réel après validation.

📝 Points essentiels

  • Un projet ML suit typiquement : collecte, nettoyage, entraînement, test, puis déploiement.
  • Uber collecte par exemple position des chauffeurs, trafic, météo et événements pour prédire prix dynamique et temps d’attente.
  • Le test doit être fait sur des données jamais vues, sinon le modèle risque de mémoriser plutôt que généraliser.
  • Le déploiement sert par exemple à la recommandation Netflix, au filtre anti spam ou à la détection de fraude.

💡 Astuce mémo

Collecter → Nettoyer → Entraîner → Tester → Déployer.

📖 5. Apprentissage supervisé

🔑 Notions clés & Définitions

  • Apprentissage supervisé : L’apprentissage supervisé utilise des données déjà étiquetées, avec la réponse attendue pour chaque exemple.
  • Données étiquetées : Des données étiquetées sont des exemples accompagnés de “bonnes réponses” connues à l’avance.
  • Emails : L’exemple d’emails “spam” ou “non spam” illustre comment un modèle apprend à partir d’étiquettes.
  • Churn : Le churn désigne le départ d’un client, que le modèle supervisé cherche à prédire.
  • Scoring crédit : Le scoring crédit est une application où un modèle supervisé estime une mesure liée à la solvabilité à partir d’exemples étiquetés.

📝 Points essentiels

  • En supervisé, le système apprend progressivement à partir d’exemples pour lesquels on connaît les réponses attendues.
  • Les exemples de tâches supervisées incluent fraude bancaire, scoring crédit, diagnostic médical, prédiction churn et prévision des ventes.
  • Le contenu “gagnez 10000€” peut être associé à “spam” et “facture EDF” à “non spam” pour entraîner le modèle.
  • Le supervisé est présenté comme le type d’apprentissage le plus utilisé en entreprise.

💡 Astuce mémo

Supervisé = bonnes réponses fournies (étiquettes) ; le modèle apprend “avec corrigé”.

📖 6. Classification et régression

🔑 Notions clés & Définitions

  • Classification : La classification est une tâche ML où l’objectif est de prédire une catégorie ou un label parmi plusieurs.
  • Régression : La régression est une tâche ML où l’objectif est de prédire une valeur numérique.
  • Labels de décision : Les labels correspondent aux catégories attendues, par exemple fraude/non fraude ou spam/non spam.
  • Valeur à prédire : La valeur à prédire correspond à un nombre continu, comme un prix ou des ventes futures.

📝 Points essentiels

  • En classification, l’objectif est de prédire une catégorie comme “fraude ou non” ou “client partira ou restera”.
  • En régression, l’objectif est de prédire une valeur comme un prix immobilier, des ventes futures ou une consommation d’énergie.
  • Dans l’exemple assurance, la classification détermine si un dossier est frauduleux.
  • Dans l’exemple régression, le modèle peut prévoir combien de produits seront vendus le mois prochain.

💡 Astuce mémo

Classification = catégories ; Régression = nombres.

📖 7. Apprentissage non supervisé

🔑 Notions clés & Définitions

  • Apprentissage non supervisé : L’apprentissage non supervisé consiste à analyser des données sans réponse correcte fournie, afin de découvrir des structures.
  • Groupes : Les groupes sont des regroupements découverts à partir de la ressemblance entre données, sans étiquettes préalables.
  • Structures cachées : Les structures cachées désignent des motifs ou relations latentes repérés par le modèle dans les données.
  • Anomalies : Les anomalies sont des comportements ou observations inhabituels identifiés par comparaison au reste des données.
  • Segmentation clients : La segmentation clients est une application non supervisée où le modèle répartit des clients dans des groupes comme étudiants ou premium.

📝 Points essentiels

  • En non supervisé, le système reçoit uniquement des données : aucune réponse correcte n’est fournie.
  • Le non supervisé vise à découvrir groupes, structures cachées et anomalies à partir des données disponibles.
  • Pour la segmentation, un système peut répartir 2 millions de clients en catégories comme étudiants, familles, premium et occasionnels.
  • En cybersécurité, le modèle cherche un comportement inhabituel sans avoir vu l’attaque auparavant.

💡 Astuce mémo

Non supervisé = pas de “réponses”, mais découverte de motifs, groupes et anomalies.

📖 8. Deep Learning et réseaux neuronaux

🔑 Notions clés & Définitions

  • Réseaux neuronaux profonds : Un réseau neuronal profond est un modèle composé de nombreuses couches qui apprennent progressivement des informations de plus en plus complexes.
  • Couches : Les couches du réseau transforment les données étape par étape pour apprendre des caractéristiques plus élaborées.
  • Reconnaissance d’images : La reconnaissance d’images est une tâche où le deep learning apprend à identifier des objets, comme un chat, à partir de pixels.
  • Chaîne de caractéristiques : La chaîne de caractéristiques décrit l’idée que des couches successives apprennent des traits simples puis des motifs complexes.

📝 Points essentiels

  • Le deep learning est présenté comme une réponse aux limites du machine learning classique sur image, audio, vidéo et langage.
  • Chaque couche apprend progressivement des informations plus complexes, ce qui permet d’aboutir à une décision comme “chat”.
  • Dans l’exemple chat : premières couches détectent lignes et formes, couches intermédiaires apprennent oreilles et yeux, et les dernières identifient un visage félin.
  • Même logique appliquée à la voiture autonome, la reconnaissance vocale et la radiologie dans le texte.

💡 Astuce mémo

Couches simples → caractéristiques plus riches → décision finale.

📖 9. GPU et modèles de langage

🔑 Notions clés & Définitions

  • GPU : Le GPU est un processeur conçu pour exécuter énormément de calculs en parallèle, utile pour entraîner des modèles coûteux.
  • CPU : Le CPU est décrit comme capable de réaliser quelques calculs très rapides par rapport au GPU en entraînement à grande échelle.
  • LLM : Un LLM est un modèle de langage spécialisé qui traite de grandes quantités de texte pour produire du texte probable.
  • Large Language Models : L’expression LLM correspond aux modèles de langage qui prédisent la suite de texte la plus probable à partir du contexte.
  • Hallucination : Une hallucination est un cas où un LLM produit une réponse inventée, car il prédit plutôt qu’il ne “sait”.

📝 Points essentiels

  • Le deep learning nécessite énormément de calculs, et les GPU ont rendu possible la révolution actuelle.
  • Le texte compare CPU : quelques calculs rapides, et GPU : milliers de calculs simultanés.
  • Pour un gros modèle, le CPU est présenté comme demandant plusieurs semaines d’entraînement contre quelques heures ou jours avec un GPU.
  • Sans GPU, le texte affirme qu’il n’y aurait pas ChatGPT, pas de génération d’images moderne et pas de véhicules autonomes.
  • Un LLM prédit le texte le plus probable en observant énormément de texte, ce qui explique des hallucinations en cas de questions nécessitant des faits inconnus.

💡 Astuce mémo

GPU = parallèle massif ; LLM = prédire la suite la plus probable.

📖 10. Limites, biais et enjeux

🔑 Notions clés & Définitions

  • Qualité des données : La qualité des données détermine la fiabilité d’un modèle, car sans données fiables on ne peut pas obtenir de modèle fiable.
  • Biais : Le biais correspond à une distorsion introduite par des données biaisées qui conduit à des résultats eux-mêmes biaisés.
  • Coût : Le coût désigne les ressources nécessaires pour entraîner des modèles très gros, notamment GPU, énergie et infrastructure lourde.
  • Explicabilité : L’explicabilité décrit la difficulté à comprendre pourquoi un modèle fonctionne même quand on observe qu’il donne de bons résultats.
  • Enjeux éthiques : Les enjeux éthiques regroupent les questions liées à la vie privée, la surveillance, la discrimination et l’impact sur l’emploi.

📝 Points essentiels

  • Sans données fiables, il n’y a pas de modèle fiable même si la technique existe.
  • Des données biaisées entraînent des résultats biaisés, ce qui peut créer des injustices ou erreurs systématiques.
  • Les très gros modèles exigent des GPU coûteux, une énergie importante et une infrastructure lourde.
  • Parfois on sait qu’un modèle fonctionne, mais on ne sait pas pourquoi, ce qui pose un problème d’explicabilité.
  • Les enjeux éthiques cités incluent vie privée, surveillance, discrimination et impact sur l’emploi.

💡 Astuce mémo

Données → qualité et biais ; Modèle → coût et explicabilité ; Société → éthique (vie privée, surveillance, discrimination, emploi).

📊 Tableaux de synthèse

Périmètres IA, ML, Deep Learning

NotionPositionCe que fait l’approche
IAdomaine globalregroupe plusieurs approches pour des tâches d’intelligence
Machine Learningbranche de l’IAapprend automatiquement à partir des données
Deep Learningbranche du MLutilise des réseaux neuronaux profonds

Supervisé vs non supervisé

TypeDonnéesObjectif principal
Supervisédonnées étiquetéesapprendre à partir des bonnes réponses
Non supervisédonnées sans réponsesdécouvrir groupes, structures cachées et anomalies

⚠️ Pièges & confusions fréquents

  1. Confondre IA et Machine Learning : l’IA est le domaine global, alors que le ML est une branche où l’apprentissage vient des données.
  2. Croire que le machine learning suit des règles “si condition alors action” : dans le texte, il apprend à partir d’exemples plutôt que de coder toutes les règles.
  3. Penser que le test peut réutiliser des données vues : le texte insiste que le modèle doit fonctionner sur des données jamais vues pour éviter le simple mémorisation.
  4. Mélanger classification et régression : la classification vise une catégorie, tandis que la régression vise une valeur numérique.
  5. Sous-estimer le rôle des données : le texte affirme qu’il n’y a pas d’apprentissage sans données et qu’une mauvaise qualité dégrade les résultats.
  6. Supposer qu’un LLM “sait” des faits : le texte explique qu’il prédit, ce qui mène à des hallucinations lorsque l’info est inconnue.
  7. Confondre biais et hasard : le texte relie explicitement des résultats biaisés à des données biaisées.

✅ Checklist Examen

  1. Définir l’intelligence artificielle comme l’ensemble de technologies capables d’exécuter des tâches liées à des capacités humaines.
  2. Expliquer la relation d’emboîtement entre IA, Machine Learning et Deep Learning.
  3. Donner au moins deux exemples d’IA cités (Netflix, Spotify, Google Maps, banques, réseaux sociaux).
  4. Relier “sans données : pas d’apprentissage” et “Garbage In, Garbage Out” à l’idée de qualité des données.
  5. Lister l’enchaînement typique d’un projet Machine Learning : collecte, nettoyage, entraînement, test, déploiement.
  6. Justifier pourquoi le nettoyage est nécessaire avec au moins deux types de problèmes cités (erreurs, doublons, valeurs manquantes).
  7. Expliquer la différence entre apprentissage supervisé (données étiquetées) et non supervisé (données sans réponses).
  8. Classer des tâches : reconnaître qu’en classification on prédit une catégorie et en régression on prédit une valeur numérique.
  9. Donner au moins un exemple de classification (fraude ou non, spam ou non) et un exemple de régression (prix, ventes futures).
  10. Expliquer pourquoi le deep learning est proposé pour image, audio, vidéo et langage plutôt que le machine learning classique.
  11. Décrire le rôle des GPU vs CPU en termes de parallélisme et d’impact sur la durée d’entraînement.
  12. Expliquer le principe des LLM et pourquoi ils peuvent halluciner (prédire sans “savoir”).
  13. Lister au moins trois limites/enjeux : qualité des données, biais, coût, explicabilité, éthique (vie privée/surveillance/discrimination/emploi).

Тествайте знанията си

Тествайте знанията си по Introduction à l'Intelligence Artificielle et ses Enjeux с 20 въпроса с множество отговори с подробни корекции.

1. Que désigne principalement l’intelligence artificielle ?

2. Quel exemple illustre le mieux une fonction typique d’un système d’intelligence artificielle ?

Вземете теста →

Прегледайте с флашкарти

Запомнете ключовите концепции на Introduction à l'Intelligence Artificielle et ses Enjeux с 20 интерактивни флашкарти.

Intelligence Artificielle — définition ?

Technologies permettant à une machine d'exécuter des tâches humaines.

IA, ML, Deep Learning — relation ?

IA est le domaine global, ML en est une branche, Deep Learning en est une sous-branche.

Rôle central des données — pourquoi ?

Elles alimentent l'apprentissage et déterminent la qualité des résultats.

Вижте флашкартите →

Similar courses

Създайте свои собствени листове за преговор

Импортирайте курса си и AI генерира листове, тестове и флашкарти за 30 секунди.

Генератор на листове