Hoja de repaso: Introduction aux fondamentaux de l'IA et ses applications

📋 Plan du Cours

  1. Objectifs du cours et plan général
  2. IAG, IAA : vocabulaire et paradigmes
  3. IA mécanique, cognitive, émotionnelle et générative
  4. Agents IA et prompts pour l’automatisation
  5. Écosystème IA : architecture, acteurs et modèles économiques
  6. Données numériques : accès, éthique et entraînement
  7. De l’entraînement à l’inférence et fonctionnement des modèles
  8. Impacts organisationnels et stratégie centaur
  9. Applications marketing et outils d’IA
  10. IA pour la recherche en sciences de gestion

📖 1. Objectifs du cours et plan général

🔑 Notions clés & Définitions

  • Marketing et Interfaces Digitales : Cours centré sur les interfaces homme-machine appliquées au marketing, en contexte professionnel ou de recherche.
  • Intelligence Artificielle : Thème du cours portant sur les concepts, la construction des modèles, l’usage en organisations et les pratiques liées à l’IA.
  • Interfaces Vocales : Deuxième thème du cours, traité par un intervenant dédié, avec une progression sur plusieurs dates.
  • Contrôle continu en groupe : Modalité d’évaluation basée sur un projet réalisé en groupe.
  • Contrôle terminal : Modalité d’évaluation par devoir individuel sur table.

📝 Points essentiels

  • Objectif global : acquérir les fondamentaux des interfaces homme-machine pour pratiquer le marketing en cadre pro ou recherche.
  • Le cours est organisé en 2 parties et 2 intervenants, avec des dates dédiées à l’Intelligence Artificielle et aux Interfaces Vocales.
  • Intelligence Artificielle : maîtrise du vocabulaire et des concepts clés de l’IA.
  • Intelligence Artificielle : maîtrise des enjeux éthiques liés aux données et aux modèles.
  • Intelligence Artificielle : savoir créer des prompts pour automatiser une tâche.
  • Intelligence Artificielle : savoir choisir des outils IA pour résoudre un problème de recherche.

💡 Astuce mémo

IA = Vocabulaire + Éthique + Prompts + Outils (VÉPO).

📖 2. IAG, IAA : vocabulaire et paradigmes

🔑 Notions clés & Définitions

  • IA mécanique : L’IA mécanique regroupe des systèmes qui apprennent à partir de données structurées pour classer et aider à décider.
  • IA cognitive : L’IA cognitive vise le traitement de données non structurées afin d’interpréter du texte, des images ou de l’audio.
  • IA émotionnelle : L’IA émotionnelle cherche à repérer des sentiments et émotions à partir de données non structurées comme texte, image ou audio.
  • IA générative : L’IA générative produit de nouvelles données à partir de modèles probabilistes, en réponse aux sollicitations de l’utilisateur.
  • Paradigme génératif : Le paradigme génératif désigne l’approche moderne portée par la puissance de calcul, le big data et le deep learning pour entraîner des modèles génératifs.

📝 Points essentiels

  • Les approches probabilistes sont mobilisées en NLP et en analyse d’images pour modéliser et exploiter des données complexes.
  • IA mécanique : apprentissage supervisé ou non supervisé avec données structurées (numériques) pour classification et aide à la décision.
  • IA cognitive : apprentissage supervisé ou non supervisé avec données non structurées (texte, image, audio) pour tâches comme traitement du langage, détection d’objet et reconnaissance vocale.
  • IA émotionnelle : apprentissage supervisé ou non supervisé avec données non structurées pour détecter sentiments et émotions.
  • IA générative : modèles probabilistes (ex. transformers, diffusers) et données non structurées pour générer de nouvelles données selon les demandes utilisateur.
  • Le paradigme génératif (2010-…) s’appuie sur l’augmentation de la puissance de calcul, le big data et le deep learning pour entraîner des modèles génératifs.

💡 Astuce mémo

Mécanique = données structurées → décider ; Cognitive = non structuré → comprendre ; Émotionnelle = non structuré → ressentir ; Générative = probabiliste → créer.

📖 3. IA mécanique, cognitive, émotionnelle et générative

🔑 Notions clés & Définitions

  • IA générative : IA générative : famille d’IA capable de produire de nouveaux contenus (texte, images, etc.) à partir d’un apprentissage sur de grandes masses de données.
  • LLM : LLM : modèle de langage à grande échelle entraîné sur de très grands corpus pour générer et comprendre du texte via des mécanismes de type transformeur.
  • Machine learning : Machine learning : approche où un modèle apprend des régularités à partir de données pour faire des prédictions ou des décisions.
  • Deep learning : Deep learning : sous-domaine du machine learning utilisant des réseaux de neurones profonds pour apprendre des représentations complexes.
  • Transformers : Transformers : architecture de réseaux de neurones basée sur l’attention, devenue centrale pour les LLMs.

📝 Points essentiels

  • Machine learning et deep learning sont des familles d’IA utilisées pour apprendre à partir de données plutôt que de coder des règles fixes.
  • L’attention (mécanisme d’attention) est un jalon clé avant l’essor des architectures de type transformers.
  • Repères chronologiques : 2003 LDA, 2006 deep learning, 2009 ReLU, 2010 ImageNet, 2015 attention, 2017 transformers, 2018 BERT, 2019 GPT-2, 2021 DALL-E, 2022 ChatGPT, 2023 GPT-4 et autres, 2024 GPT-4o et Gemini, 2025 GPT-
  • GPT-3 (2020) puis ChatGPT (novembre 2022, GPT-3.5) illustrent la transition vers des LLMs orientés génération conversationnelle.
  • Les LLMs s’appuient sur des architectures comme les transformers et sont entraînés sur des données numériques massives (mots, images, etc.).
  • Les données d’entraînement nécessitent mise en forme, labellisation et vérification pour préparer l’apprentissage.

💡 Astuce mémo

ML → DL → Attention → Transformers → LLM → Génération (repère : 2015 attention, 2017 transformers, 2022 ChatGPT).

📖 4. Agents IA et prompts pour l’automatisation

🔑 Notions clés & Définitions

  • ChatGPT (GPT 3.5) : Modèle de langage de la famille GPT, présenté comme ChatGPT avec GPT 3.5, marquant une étape majeure pour l’usage conversationnel.
  • GPT-4 : Modèle de langage de nouvelle génération, cité comme successeur de GPT-3 et utilisé pour des capacités plus avancées que GPT-3.
  • Bard : Agent conversationnel de Google mentionné comme concurrent des modèles de langage récents pour l’automatisation via texte.
  • Claude : Famille de modèles conversationnels citée comme alternative à GPT et Bard, utilisée pour des tâches assistées par prompts.
  • Grok : Modèle conversationnel mentionné parmi les systèmes récents, associé à l’automatisation par génération de texte.

📝 Points essentiels

  • Chronologie des modèles cités : 2020 (GPT-3), 2022 (ChatGPT/GPT 3.5), 2023 (GPT-4, Bard, Claude, Qwen), 2024 (GPT-4o, Gemini, Claude 3, Qwen 2, Grok), 2025 (GPT-5, DeepSeek, Claude 4, Qwen 3).
  • Les données d’entraînement combinent souvent des sources publiques, des données propriétaires et parfois des données générées, ce qui pose des enjeux d’accès et d’éthique.
  • Common Crawl est présenté comme une archive web fournissant un accès public aux données web.
  • WebText est un dataset de texte web créé par OpenAI, utilisé comme source d’entraînement pour des modèles de langage.
  • Books1 et Books2 désignent deux collections de livres numériques citées comme sources de texte.
  • Wikipedia est indiquée comme source de texte libre et collaborative, utilisée pour l’entraînement de modèles de langage.

📖 5. Écosystème IA : architecture, acteurs et modèles économiques

🔑 Notions clés & Définitions

  • Données d’entraînement : Ensemble de données utilisées pour ajuster les paramètres d’un modèle avant son usage réel.
  • Inférence : Phase où le modèle répond à des requêtes en produisant une sortie à partir des données d’entrée.
  • Datacenters : Sites informatiques regroupant serveurs et infrastructures nécessaires aux calculs lourds d’entraînement et d’inférence.
  • RAG : Approche combinant un modèle de langage avec une recherche de documents pour enrichir la réponse à partir de sources externes.
  • Word2Vec : Modèle de représentation de mots qui apprend des vecteurs en capturant des relations sémantiques entre termes.

📝 Points essentiels

  • Deux grandes sources de données numériques sont mobilisées : texte libre collaboratif (ex. Wikipedia) et dépôts de code (ex. GitHub).
  • Les entreprises utilisent aussi des données propriétaires collectées et enrichies, en plus des données accessibles publiquement.
  • Le pipeline d’entraînement inclut des étapes comme le pré-traitement et la labellisation avant l’ajustement du modèle.
  • L’entraînement demande des ressources massives : beaucoup de calculs, des datacenters, des GPU et des modèles avec des milliards de paramètres.
  • L’inférence correspond aux requêtes utilisateur via une interface, après la phase d’entraînement.
  • Les modèles de type Word2Vec sont associés à Mikolov et al. (2013) pour l’apprentissage de représentations de mots en espace vectoriel.

💡 Astuce mémo

Entraîner = calculer (datacenters/GPU) ; Inférer = répondre (requêtes) ; RAG = Chercher + Répondre.

📖 6. Données numériques : accès, éthique et entraînement

🔑 Notions clés & Définitions

  • Accès aux données : Ensemble des modalités qui permettent d’obtenir, consulter et exploiter des données numériques dans une organisation.
  • Éthique des données : Cadre de principes qui encadre l’usage des données pour limiter les abus, protéger les personnes et préserver la confiance.
  • Entraînement d’un modèle : Phase où un système d’IA apprend à partir de données pour produire des prédictions, classements ou contenus.
  • Comportement centaure : Approche où humains et IA se partagent le travail en fonction des forces de chacun, avec une division par sous-tâches.
  • Comportement cyborg : Approche où humains et IA s’entremêlent au niveau des sous-tâches, rendant parfois difficile la séparation des contributions.

📝 Points essentiels

  • La performance organisationnelle peut être améliorée par l’IA via l’efficacité, le gain de temps et des décisions mieux informées.
  • La transformation des métiers passe aussi par la montée en compétences, car les utilisateurs apprennent à collaborer avec l’IA.
  • Les fonctionnalités d’IA citées incluent centralisation de l’information, extraction et synthèse, création de contenus, personnalisation et recommandation.
  • L’IA peut faciliter la communication et la collaboration, ainsi que la formation et l’apprentissage au sein des équipes.
  • Les comportements centaure et cyborg décrivent deux façons de répartir le travail humain/IA, du partage net à l’intégration très serrée.
  • Les plateformes de prompts sont présentées comme des exemples d’outils liés à l’usage pratique de l’IA (ex. promptbase.com, promptrr.dev).

💡 Astuce mémo

Centaure = partage clair par sous-tâches ; Cyborg = fusion au niveau des sous-tâches.

📖 7. De l’entraînement à l’inférence et fonctionnement des modèles

🔑 Notions clés & Définitions

  • Formation et apprentissage : Ensemble des étapes où un modèle ajuste ses paramètres à partir de données pour apprendre des régularités utiles.
  • Inférence : Phase d’utilisation où le modèle applique ce qu’il a appris pour produire une prédiction ou une réponse sur de nouvelles entrées.
  • Plateformes de prompt : Services qui facilitent la création, l’échange et l’utilisation de prompts pour obtenir des résultats plus efficaces avec des modèles.
  • Applications au marketing : Usages concrets des modèles pour améliorer la relation client, la création de contenu, l’analyse et l’automatisation des campagnes.
  • Analyse de données et traitement de l’information : Exploitation de données clients ou marché pour extraire des signaux et alimenter des décisions marketing via des modèles.

📝 Points essentiels

  • La formation vise à apprendre à partir de données, tandis que l’inférence sert à produire des sorties sur des données nouvelles.
  • Les plateformes de prompt comme promptbase.com et promptrr.dev aident à industrialiser l’usage des prompts.
  • En marketing, les chatbots et assistants virtuels soutiennent la relation client et l’assistance aux équipes.
  • La génération et la curation de contenu couvrent des posts, articles et descriptions de produits via des sorties du modèle.
  • Le lead scoring utilise des algorithmes de machine learning pour estimer le comportement futur à partir des données clients.
  • Le suivi de réputation repose sur la surveillance des mentions et l’analyse de sentiment des retours clients et discussions en ligne.

📖 8. Impacts organisationnels et stratégie centaur

🔑 Notions clés & Définitions

  • Éclat Énergie : Boisson présentée comme un jus de fruit naturel, pensée pour le bien-être et le plaisir au quotidien.
  • Ingrédients naturels : Caractéristique produit indiquant une fabrication à partir d’ingrédients 100% naturels, sans conservateurs artificiels.
  • Boost énergétique naturel : Promesse de formulation visant un regain d’énergie issu du produit, adapté au matin ou à la mi-journée.
  • Packaging recyclable : Choix d’emballage annoncé comme utilisant des matériaux recyclables pour réduire l’empreinte écologique.

📝 Points essentiels

  • Le produit est décrit comme sans conservateurs artificiels et fabriqué avec des ingrédients 100% naturels.
  • Le positionnement met en avant une expérience de dégustation fruitée et rafraîchissante.
  • La boisson est formulée pour fournir un boost d’énergie naturelle, utile pour démarrer la journée ou relancer l’après-midi.
  • Le packaging est annoncé comme moderne et attractif grâce à des couleurs vives et des motifs dynamiques.
  • La praticité est assurée par une canette de 330 ml, facile à transporter au bureau, en salle de sport ou en déplacement.
  • L’engagement écologique repose sur l’utilisation de matériaux recyclables pour limiter l’empreinte environnementale.

💡 Astuce mémo

Nature = sans artifices ; Énergie = matin + après-midi ; Style = couleurs/motifs ; Pratique = canette 330 ml ; Écolo = recyclable.

📖 9. Applications marketing et outils d’IA

🔑 Notions clés & Définitions

  • Text mining marketing : Analyse de grands volumes de textes pour extraire des informations exploitables en marketing.
  • Assisté par ordinateur : Utilisation de logiciels et langages informatiques pour traiter automatiquement des données textuelles massives.
  • Corpus de textes : Ensemble structuré de documents textuels utilisé comme matière première pour l’analyse.
  • UGC : Contenus créés par les utilisateurs, comme commentaires, blogs ou publications sur les réseaux sociaux.
  • Web scraping : Collecte automatisée de données depuis des pages web pour constituer un corpus exploitable.

📝 Points essentiels

  • Le traitement de données textuelles massives s’appuie sur des outils d’analyse et des logiciels dédiés, souvent via des langages comme R ou Python.
  • Les corpus peuvent inclure des articles, rapports, publications artistiques, manuels, discours, et aussi des contenus générés par les utilisateurs (UGC).
  • Pour constituer un corpus, on mobilise des datasets, bases de données, APIs, enquêtes/sondages, ou encore du web scraping.
  • Une étude de référence sur le scraping web pour des insights marketing est Boegershausen, Datta, Borah et Stephen (2022) dans le Journal of Marketing.
  • Un exemple de base de données d’avis clients est TP_pets de Balech (2024), portant sur 341 613 avis concernant 220 sites web.
  • Les choix de sources de données doivent être alignés avec la problématique de recherche (C) SB2025 72 et (C) SB2025 73.

💡 Astuce mémo

Corpus = Articles/Rapports/Discours + UGC, et collecte = Datasets/APIs/Enquêtes/Web scraping.

📖 10. IA pour la recherche en sciences de gestion

🔑 Notions clés & Définitions

  • Corpus : Un corpus est une collection de documents utilisée pour étudier des régularités textuelles et tester des hypothèses.
  • Document : Un document correspond à un ensemble de tokens accompagné de métadonnées permettant de contextualiser le texte.
  • Tokens : Les tokens sont les unités textuelles (morceaux de mots ou mots) sur lesquelles portent les analyses statistiques et linguistiques.
  • Bag of words : Le bag of words représente un document comme un sac de tokens, en ignorant l’ordre des mots tout en conservant leurs occurrences.
  • Stylométrie : La stylométrie regroupe des mesures quantitatives du style d’écriture (lisibilité, diversité lexicale, longueur, pronoms, émojis, casse, conjugaison).

📝 Points essentiels

  • Une démarche de recherche en IA commence par la constitution du corpus, puis des pré-traitements, des annotations, avant l’analyse proprement dite.
  • L’analyse textuelle s’appuie sur des hypothèses concernant la distribution des mots dans les documents.
  • Deux grandes approches du texte existent : l’approche syntaxique (fonction et position des mots) et le bag of words (ensemble de tokens).
  • Trois familles d’outils sont mobilisées : fréquence (wordcloud, co-occurrences, topics, embeddings), annotation (phrases, réseaux sémantiques, dépendances syntaxiques, entités nommées, sentiment, dictionnaires, classif.)
  • La stylométrie exploite des indicateurs de style pour caractériser ou comparer des contenus, par exemple via pronoms, émojis, casse et conjugaison.
  • Question de recherche illustrée : tutoiement singulier vs pluriel selon la nature du contenu, testée sur 27 615 posts, 25 marques, sur Twitter, Instagram et Facebook.

💡 Astuce mémo

Corpus = Documents = Tokens + métadonnées ; Syntaxe vs Bag of words ; Outils : Fréquences / Annotation / Stylométrie ; Étapes : Corpus → Pré-traitements → Annotations → Analyse.

📅 Repères chronologiques

DateÉvénement
29/01Début du thème Intelligence Artificielle (Sophie Balech)
19/02Séance Intelligence Artificielle (construction des modèles d’IA)
2 avrilSéance Intelligence Artificielle : Pratiques de l’IA 2/2
9 avrilSéance Intelligence Artificielle : IA pour la recherche en sciences de gestion
05/02Début du thème Interfaces Vocales (Nicolas Kusz)
2010-…Paradigme génératif (puissance de calcul + big data + deep learning)
2003LDA (repère chronologique des modèles/approches)
2006Concept de deep learning (repère chronologique)
2009Fonction ReLU (repère chronologique)
2010ImageNet Challenge (repère chronologique)

📊 Tableaux de synthèse

Paradigmes de l’IA (repères)

ParadigmePériodeIdée centrale
Symbolique1950-1980Manipulation de symboles via des opérations élémentaires (systèmes expert)
Connexionniste1980-2010Réseaux de neurones artificiels pour reconnaissance de patterns
Statistique1990-2010Big data et méthodes probabilistes (NLP, analyse d’images)
Génératif2010-…Puissance de calcul + big data + deep learning (modèles génératifs)

Types d’IA (données et tâches)

Type d’IADonnéesObjectif
IA mécaniqueDonnées structurées (numériques)Classification et aide à la prise de décision
IA cognitiveDonnées non-structurées (texte, image, audio)Traitement automatique du langage, détection d’objet, reconnaissance vocale
IA émotionnelleDonnées non-structurées (texte, image, audio)Détection des sentiments et émotions
IA générativeDonnées non-structuréesProduire de nouvelles données selon les sollicitations de l’utilisateur

⚠️ Pièges & confusions fréquents

  1. Confondre paradigme symbolique (1950-1980) et connexionniste (1980-2010) : l’un manipule des symboles, l’autre apprend des patterns via réseaux de neurones.
  2. Croire que l’IA générative sert uniquement à “analyser” : elle produit de nouvelles données en fonction des sollicitations de l’utilisateur.
  3. Mélanger entraînement et inférence : l’entraînement ajuste le modèle avec des données, l’inférence répond aux requêtes via une interface.
  4. Penser que “cognitive” et “émotionnelle” utilisent les mêmes objectifs : les deux traitent du non-structuré, mais l’émotionnelle vise sentiments/émotions.
  5. Oublier que les prompts sont une description textuelle de la tâche : ce n’est pas un modèle en soi, mais un moyen d’orienter l’IA.
  6. Confondre bag of words et approche syntaxique : bag of words ignore l’ordre et conserve les occurrences de tokens.
  7. Croire que RAG remplace l’entraînement : RAG combine modèle de langage et recherche de documents pour enrichir la réponse avec des sources externes.

✅ Checklist Examen

  1. Savoir distinguer IAG/IAA et relier IA générative vs analytique vs agentique aux usages du cours.
  2. Savoir associer chaque paradigme (symbolique, connexionniste, statistique, génératif) à sa période et à son principe.
  3. Savoir classer IA mécanique/cognitive/émotionnelle/générative selon le type de données (structurées vs non-structurées) et la tâche (décider, comprendre, ressentir, créer).
  4. Maîtriser les repères chronologiques fournis (ex. 2003 LDA, 2015 attention, 2017 transformers, 2022 ChatGPT, 2023 GPT-4/Bard/Claude/Qwen, 2024 GPT-4o/Gemini/Grok, 2025 GPT-5/DeepSeek/Claude 4/Qwen 3).
  5. Savoir définir un agent IA et un prompt, et expliquer leur rôle dans l’automatisation.
  6. Connaître les acteurs et catégories d’acteurs de l’écosystème (généralistes, spécialistes modèles, hardware) et distinguer modèles fermés vs open source.
  7. Savoir décrire le pipeline de construction des modèles : données d’entraînement (pré-traitement, labellisation, vérification), entraînement (calcul, datacenters/GPU), puis inférence (requêtes).
  8. Savoir citer des sources de données d’entraînement mentionnées (Common Crawl, WebText, Books1/Books2, Wikipedia, code/GitHub, données propriétaires) et l’enjeu éthique (transparence, droits d’auteurs, biais).
  9. Savoir expliquer la différence entre comportement centaure et comportement cyborg au niveau de la division du travail (par sous-tâches vs intégration serrée).
  10. Savoir relier les impacts organisationnels à des exemples du cours (performance, transformation des métiers, montée en compétences, centralisation/extraction/synthèse, création de contenus, personnalisation/recommand. ).
  11. Savoir mobiliser les applications marketing vues : relation client (chatbots, suivi réputation), gestion de marque, communication (création/automatisation/KPIs), lead scoring, monitoring social et sentiment.
  12. En recherche en sciences de gestion, savoir définir corpus/document/tokens/bag of words/stylométrie, puis décrire les étapes (corpus → pré-traitements → annotations → analyse) et les familles d’outils (fréquences, annnot
  13. stylométrie) ainsi que l’exemple du QR sur tutoiement singulier vs pluriel (27 615 posts, 25 marques, Twitter/Instagram/Facebook).

Pon a prueba tus conocimientos

Pon a prueba tus conocimientos sobre Introduction aux fondamentaux de l'IA et ses applications con 20 preguntas de opción múltiple con correcciones detalladas.

1. Quelle est la première étape d’une démarche de recherche en IA appliquée aux sciences de gestion ?

2. Que représente le bag of words ?

Realiza el cuestionario →

Repasa con tarjetas de memoria

Memoriza los conceptos clave de Introduction aux fondamentaux de l'IA et ses applications con 20 tarjetas de memoria interactivas.

Objectifs du cours

Maîtriser les fondamentaux des interfaces homme-machine en marketing.

IAG vs IAA

Vocabulaire et paradigmes distincts de l’intelligence artificielle.

IA mécanique — rôle ?

Classer et aider à la décision avec données structurées.

Ver tarjetas de memoria →

Similar courses

Crea tus propias hojas de repaso

Importa tu curso y la IA genera hojas, cuestionarios y tarjetas de memoria en 30 segundos.

Generador de hojas