Hoja de Repaso: Introduction aux fondamentaux de l'IA et ses applications

Plan du Cours

Objectifs du cours et plan général
IAG, IAA : vocabulaire et paradigmes
IA mécanique, cognitive, émotionnelle et générative
Agents IA et prompts pour l’automatisation
Écosystème IA : architecture, acteurs et modèles économiques
Données numériques : accès, éthique et entraînement
De l’entraînement à l’inférence et fonctionnement des modèles
Impacts organisationnels et stratégie centaur
Applications marketing et outils d’IA
IA pour la recherche en sciences de gestion

1. Objectifs du cours et plan général

Notions clés & Définitions

Marketing et Interfaces Digitales : Cours centré sur les interfaces homme-machine appliquées au marketing, en contexte professionnel ou de recherche.
Intelligence Artificielle : Thème du cours portant sur les concepts, la construction des modèles, l’usage en organisations et les pratiques liées à l’IA.
Interfaces Vocales : Deuxième thème du cours, traité par un intervenant dédié, avec une progression sur plusieurs dates.
Contrôle continu en groupe : Modalité d’évaluation basée sur un projet réalisé en groupe.
Contrôle terminal : Modalité d’évaluation par devoir individuel sur table.

Points essentiels

Objectif global : acquérir les fondamentaux des interfaces homme-machine pour pratiquer le marketing en cadre pro ou recherche.
Le cours est organisé en 2 parties et 2 intervenants, avec des dates dédiées à l’Intelligence Artificielle et aux Interfaces Vocales.
Intelligence Artificielle : maîtrise du vocabulaire et des concepts clés de l’IA.
Intelligence Artificielle : maîtrise des enjeux éthiques liés aux données et aux modèles.
Intelligence Artificielle : savoir créer des prompts pour automatiser une tâche.
Intelligence Artificielle : savoir choisir des outils IA pour résoudre un problème de recherche.

Astuce mémo

IA = Vocabulaire + Éthique + Prompts + Outils (VÉPO).

2. IAG, IAA : vocabulaire et paradigmes

Notions clés & Définitions

IA mécanique : L’IA mécanique regroupe des systèmes qui apprennent à partir de données structurées pour classer et aider à décider.
IA cognitive : L’IA cognitive vise le traitement de données non structurées afin d’interpréter du texte, des images ou de l’audio.
IA émotionnelle : L’IA émotionnelle cherche à repérer des sentiments et émotions à partir de données non structurées comme texte, image ou audio.
IA générative : L’IA générative produit de nouvelles données à partir de modèles probabilistes, en réponse aux sollicitations de l’utilisateur.
Paradigme génératif : Le paradigme génératif désigne l’approche moderne portée par la puissance de calcul, le big data et le deep learning pour entraîner des modèles génératifs.

Points essentiels

Les approches probabilistes sont mobilisées en NLP et en analyse d’images pour modéliser et exploiter des données complexes.
IA mécanique : apprentissage supervisé ou non supervisé avec données structurées (numériques) pour classification et aide à la décision.
IA cognitive : apprentissage supervisé ou non supervisé avec données non structurées (texte, image, audio) pour tâches comme traitement du langage, détection d’objet et reconnaissance vocale.
IA émotionnelle : apprentissage supervisé ou non supervisé avec données non structurées pour détecter sentiments et émotions.
IA générative : modèles probabilistes (ex. transformers, diffusers) et données non structurées pour générer de nouvelles données selon les demandes utilisateur.
Le paradigme génératif (2010-…) s’appuie sur l’augmentation de la puissance de calcul, le big data et le deep learning pour entraîner des modèles génératifs.

Astuce mémo

Mécanique = données structurées → décider ; Cognitive = non structuré → comprendre ; Émotionnelle = non structuré → ressentir ; Générative = probabiliste → créer.

3. IA mécanique, cognitive, émotionnelle et générative

Notions clés & Définitions

IA générative : IA générative : famille d’IA capable de produire de nouveaux contenus (texte, images, etc.) à partir d’un apprentissage sur de grandes masses de données.
LLM : LLM : modèle de langage à grande échelle entraîné sur de très grands corpus pour générer et comprendre du texte via des mécanismes de type transformeur.
Machine learning : Machine learning : approche où un modèle apprend des régularités à partir de données pour faire des prédictions ou des décisions.
Deep learning : Deep learning : sous-domaine du machine learning utilisant des réseaux de neurones profonds pour apprendre des représentations complexes.
Transformers : Transformers : architecture de réseaux de neurones basée sur l’attention, devenue centrale pour les LLMs.

Points essentiels

Machine learning et deep learning sont des familles d’IA utilisées pour apprendre à partir de données plutôt que de coder des règles fixes.
L’attention (mécanisme d’attention) est un jalon clé avant l’essor des architectures de type transformers.
Repères chronologiques : 2003 LDA, 2006 deep learning, 2009 ReLU, 2010 ImageNet, 2015 attention, 2017 transformers, 2018 BERT, 2019 GPT-2, 2021 DALL-E, 2022 ChatGPT, 2023 GPT-4 et autres, 2024 GPT-4o et Gemini, 2025 GPT-
GPT-3 (2020) puis ChatGPT (novembre 2022, GPT-3.5) illustrent la transition vers des LLMs orientés génération conversationnelle.
Les LLMs s’appuient sur des architectures comme les transformers et sont entraînés sur des données numériques massives (mots, images, etc.).
Les données d’entraînement nécessitent mise en forme, labellisation et vérification pour préparer l’apprentissage.

Astuce mémo

ML → DL → Attention → Transformers → LLM → Génération (repère : 2015 attention, 2017 transformers, 2022 ChatGPT).

4. Agents IA et prompts pour l’automatisation

Notions clés & Définitions

ChatGPT (GPT 3.5) : Modèle de langage de la famille GPT, présenté comme ChatGPT avec GPT 3.5, marquant une étape majeure pour l’usage conversationnel.
GPT-4 : Modèle de langage de nouvelle génération, cité comme successeur de GPT-3 et utilisé pour des capacités plus avancées que GPT-3.
Bard : Agent conversationnel de Google mentionné comme concurrent des modèles de langage récents pour l’automatisation via texte.
Claude : Famille de modèles conversationnels citée comme alternative à GPT et Bard, utilisée pour des tâches assistées par prompts.
Grok : Modèle conversationnel mentionné parmi les systèmes récents, associé à l’automatisation par génération de texte.

Points essentiels

Chronologie des modèles cités : 2020 (GPT-3), 2022 (ChatGPT/GPT 3.5), 2023 (GPT-4, Bard, Claude, Qwen), 2024 (GPT-4o, Gemini, Claude 3, Qwen 2, Grok), 2025 (GPT-5, DeepSeek, Claude 4, Qwen 3).
Les données d’entraînement combinent souvent des sources publiques, des données propriétaires et parfois des données générées, ce qui pose des enjeux d’accès et d’éthique.
Common Crawl est présenté comme une archive web fournissant un accès public aux données web.
WebText est un dataset de texte web créé par OpenAI, utilisé comme source d’entraînement pour des modèles de langage.
Books1 et Books2 désignent deux collections de livres numériques citées comme sources de texte.
Wikipedia est indiquée comme source de texte libre et collaborative, utilisée pour l’entraînement de modèles de langage.

5. Écosystème IA : architecture, acteurs et modèles économiques

Notions clés & Définitions

Données d’entraînement : Ensemble de données utilisées pour ajuster les paramètres d’un modèle avant son usage réel.
Inférence : Phase où le modèle répond à des requêtes en produisant une sortie à partir des données d’entrée.
Datacenters : Sites informatiques regroupant serveurs et infrastructures nécessaires aux calculs lourds d’entraînement et d’inférence.
RAG : Approche combinant un modèle de langage avec une recherche de documents pour enrichir la réponse à partir de sources externes.
Word2Vec : Modèle de représentation de mots qui apprend des vecteurs en capturant des relations sémantiques entre termes.

Points essentiels

Deux grandes sources de données numériques sont mobilisées : texte libre collaboratif (ex. Wikipedia) et dépôts de code (ex. GitHub).
Les entreprises utilisent aussi des données propriétaires collectées et enrichies, en plus des données accessibles publiquement.
Le pipeline d’entraînement inclut des étapes comme le pré-traitement et la labellisation avant l’ajustement du modèle.
L’entraînement demande des ressources massives : beaucoup de calculs, des datacenters, des GPU et des modèles avec des milliards de paramètres.
L’inférence correspond aux requêtes utilisateur via une interface, après la phase d’entraînement.
Les modèles de type Word2Vec sont associés à Mikolov et al. (2013) pour l’apprentissage de représentations de mots en espace vectoriel.

Astuce mémo

Entraîner = calculer (datacenters/GPU) ; Inférer = répondre (requêtes) ; RAG = Chercher + Répondre.

6. Données numériques : accès, éthique et entraînement

Notions clés & Définitions

Accès aux données : Ensemble des modalités qui permettent d’obtenir, consulter et exploiter des données numériques dans une organisation.
Éthique des données : Cadre de principes qui encadre l’usage des données pour limiter les abus, protéger les personnes et préserver la confiance.
Entraînement d’un modèle : Phase où un système d’IA apprend à partir de données pour produire des prédictions, classements ou contenus.
Comportement centaure : Approche où humains et IA se partagent le travail en fonction des forces de chacun, avec une division par sous-tâches.
Comportement cyborg : Approche où humains et IA s’entremêlent au niveau des sous-tâches, rendant parfois difficile la séparation des contributions.

Points essentiels

La performance organisationnelle peut être améliorée par l’IA via l’efficacité, le gain de temps et des décisions mieux informées.
La transformation des métiers passe aussi par la montée en compétences, car les utilisateurs apprennent à collaborer avec l’IA.
Les fonctionnalités d’IA citées incluent centralisation de l’information, extraction et synthèse, création de contenus, personnalisation et recommandation.
L’IA peut faciliter la communication et la collaboration, ainsi que la formation et l’apprentissage au sein des équipes.
Les comportements centaure et cyborg décrivent deux façons de répartir le travail humain/IA, du partage net à l’intégration très serrée.
Les plateformes de prompts sont présentées comme des exemples d’outils liés à l’usage pratique de l’IA (ex. promptbase.com, promptrr.dev).

Astuce mémo

Centaure = partage clair par sous-tâches ; Cyborg = fusion au niveau des sous-tâches.

7. De l’entraînement à l’inférence et fonctionnement des modèles

Notions clés & Définitions

Formation et apprentissage : Ensemble des étapes où un modèle ajuste ses paramètres à partir de données pour apprendre des régularités utiles.
Inférence : Phase d’utilisation où le modèle applique ce qu’il a appris pour produire une prédiction ou une réponse sur de nouvelles entrées.
Plateformes de prompt : Services qui facilitent la création, l’échange et l’utilisation de prompts pour obtenir des résultats plus efficaces avec des modèles.
Applications au marketing : Usages concrets des modèles pour améliorer la relation client, la création de contenu, l’analyse et l’automatisation des campagnes.
Analyse de données et traitement de l’information : Exploitation de données clients ou marché pour extraire des signaux et alimenter des décisions marketing via des modèles.

Points essentiels

La formation vise à apprendre à partir de données, tandis que l’inférence sert à produire des sorties sur des données nouvelles.
Les plateformes de prompt comme promptbase.com et promptrr.dev aident à industrialiser l’usage des prompts.
En marketing, les chatbots et assistants virtuels soutiennent la relation client et l’assistance aux équipes.
La génération et la curation de contenu couvrent des posts, articles et descriptions de produits via des sorties du modèle.
Le lead scoring utilise des algorithmes de machine learning pour estimer le comportement futur à partir des données clients.
Le suivi de réputation repose sur la surveillance des mentions et l’analyse de sentiment des retours clients et discussions en ligne.

8. Impacts organisationnels et stratégie centaur

Notions clés & Définitions

Éclat Énergie : Boisson présentée comme un jus de fruit naturel, pensée pour le bien-être et le plaisir au quotidien.
Ingrédients naturels : Caractéristique produit indiquant une fabrication à partir d’ingrédients 100% naturels, sans conservateurs artificiels.
Boost énergétique naturel : Promesse de formulation visant un regain d’énergie issu du produit, adapté au matin ou à la mi-journée.
Packaging recyclable : Choix d’emballage annoncé comme utilisant des matériaux recyclables pour réduire l’empreinte écologique.

Points essentiels

Le produit est décrit comme sans conservateurs artificiels et fabriqué avec des ingrédients 100% naturels.
Le positionnement met en avant une expérience de dégustation fruitée et rafraîchissante.
La boisson est formulée pour fournir un boost d’énergie naturelle, utile pour démarrer la journée ou relancer l’après-midi.
Le packaging est annoncé comme moderne et attractif grâce à des couleurs vives et des motifs dynamiques.
La praticité est assurée par une canette de 330 ml, facile à transporter au bureau, en salle de sport ou en déplacement.
L’engagement écologique repose sur l’utilisation de matériaux recyclables pour limiter l’empreinte environnementale.

Astuce mémo

Nature = sans artifices ; Énergie = matin + après-midi ; Style = couleurs/motifs ; Pratique = canette 330 ml ; Écolo = recyclable.

9. Applications marketing et outils d’IA

Notions clés & Définitions

Text mining marketing : Analyse de grands volumes de textes pour extraire des informations exploitables en marketing.
Assisté par ordinateur : Utilisation de logiciels et langages informatiques pour traiter automatiquement des données textuelles massives.
Corpus de textes : Ensemble structuré de documents textuels utilisé comme matière première pour l’analyse.
UGC : Contenus créés par les utilisateurs, comme commentaires, blogs ou publications sur les réseaux sociaux.
Web scraping : Collecte automatisée de données depuis des pages web pour constituer un corpus exploitable.

Points essentiels

Le traitement de données textuelles massives s’appuie sur des outils d’analyse et des logiciels dédiés, souvent via des langages comme R ou Python.
Les corpus peuvent inclure des articles, rapports, publications artistiques, manuels, discours, et aussi des contenus générés par les utilisateurs (UGC).
Pour constituer un corpus, on mobilise des datasets, bases de données, APIs, enquêtes/sondages, ou encore du web scraping.
Une étude de référence sur le scraping web pour des insights marketing est Boegershausen, Datta, Borah et Stephen (2022) dans le Journal of Marketing.
Un exemple de base de données d’avis clients est TP_pets de Balech (2024), portant sur 341 613 avis concernant 220 sites web.
Les choix de sources de données doivent être alignés avec la problématique de recherche (C) SB2025 72 et (C) SB2025 73.

Astuce mémo

Corpus = Articles/Rapports/Discours + UGC, et collecte = Datasets/APIs/Enquêtes/Web scraping.

10. IA pour la recherche en sciences de gestion

Notions clés & Définitions

Corpus : Un corpus est une collection de documents utilisée pour étudier des régularités textuelles et tester des hypothèses.
Document : Un document correspond à un ensemble de tokens accompagné de métadonnées permettant de contextualiser le texte.
Tokens : Les tokens sont les unités textuelles (morceaux de mots ou mots) sur lesquelles portent les analyses statistiques et linguistiques.
Bag of words : Le bag of words représente un document comme un sac de tokens, en ignorant l’ordre des mots tout en conservant leurs occurrences.
Stylométrie : La stylométrie regroupe des mesures quantitatives du style d’écriture (lisibilité, diversité lexicale, longueur, pronoms, émojis, casse, conjugaison).

Points essentiels

Une démarche de recherche en IA commence par la constitution du corpus, puis des pré-traitements, des annotations, avant l’analyse proprement dite.
L’analyse textuelle s’appuie sur des hypothèses concernant la distribution des mots dans les documents.
Deux grandes approches du texte existent : l’approche syntaxique (fonction et position des mots) et le bag of words (ensemble de tokens).
Trois familles d’outils sont mobilisées : fréquence (wordcloud, co-occurrences, topics, embeddings), annotation (phrases, réseaux sémantiques, dépendances syntaxiques, entités nommées, sentiment, dictionnaires, classif.)
La stylométrie exploite des indicateurs de style pour caractériser ou comparer des contenus, par exemple via pronoms, émojis, casse et conjugaison.
Question de recherche illustrée : tutoiement singulier vs pluriel selon la nature du contenu, testée sur 27 615 posts, 25 marques, sur Twitter, Instagram et Facebook.

Astuce mémo

Corpus = Documents = Tokens + métadonnées ; Syntaxe vs Bag of words ; Outils : Fréquences / Annotation / Stylométrie ; Étapes : Corpus → Pré-traitements → Annotations → Analyse.

Repères chronologiques

Date	Événement
29/01	Début du thème Intelligence Artificielle (Sophie Balech)
19/02	Séance Intelligence Artificielle (construction des modèles d’IA)
2 avril	Séance Intelligence Artificielle : Pratiques de l’IA 2/2
9 avril	Séance Intelligence Artificielle : IA pour la recherche en sciences de gestion
05/02	Début du thème Interfaces Vocales (Nicolas Kusz)
2010-…	Paradigme génératif (puissance de calcul + big data + deep learning)
2003	LDA (repère chronologique des modèles/approches)
2006	Concept de deep learning (repère chronologique)
2009	Fonction ReLU (repère chronologique)
2010	ImageNet Challenge (repère chronologique)

Tableaux de synthèse

Paradigmes de l’IA (repères)

Paradigme	Période	Idée centrale
Symbolique	1950-1980	Manipulation de symboles via des opérations élémentaires (systèmes expert)
Connexionniste	1980-2010	Réseaux de neurones artificiels pour reconnaissance de patterns
Statistique	1990-2010	Big data et méthodes probabilistes (NLP, analyse d’images)
Génératif	2010-…	Puissance de calcul + big data + deep learning (modèles génératifs)

Types d’IA (données et tâches)

Type d’IA	Données	Objectif
IA mécanique	Données structurées (numériques)	Classification et aide à la prise de décision
IA cognitive	Données non-structurées (texte, image, audio)	Traitement automatique du langage, détection d’objet, reconnaissance vocale
IA émotionnelle	Données non-structurées (texte, image, audio)	Détection des sentiments et émotions
IA générative	Données non-structurées	Produire de nouvelles données selon les sollicitations de l’utilisateur

Pièges & confusions fréquents

Confondre paradigme symbolique (1950-1980) et connexionniste (1980-2010) : l’un manipule des symboles, l’autre apprend des patterns via réseaux de neurones.
Croire que l’IA générative sert uniquement à “analyser” : elle produit de nouvelles données en fonction des sollicitations de l’utilisateur.
Mélanger entraînement et inférence : l’entraînement ajuste le modèle avec des données, l’inférence répond aux requêtes via une interface.
Penser que “cognitive” et “émotionnelle” utilisent les mêmes objectifs : les deux traitent du non-structuré, mais l’émotionnelle vise sentiments/émotions.
Oublier que les prompts sont une description textuelle de la tâche : ce n’est pas un modèle en soi, mais un moyen d’orienter l’IA.
Confondre bag of words et approche syntaxique : bag of words ignore l’ordre et conserve les occurrences de tokens.
Croire que RAG remplace l’entraînement : RAG combine modèle de langage et recherche de documents pour enrichir la réponse avec des sources externes.

Checklist Examen

Savoir distinguer IAG/IAA et relier IA générative vs analytique vs agentique aux usages du cours.
Savoir associer chaque paradigme (symbolique, connexionniste, statistique, génératif) à sa période et à son principe.
Savoir classer IA mécanique/cognitive/émotionnelle/générative selon le type de données (structurées vs non-structurées) et la tâche (décider, comprendre, ressentir, créer).
Maîtriser les repères chronologiques fournis (ex. 2003 LDA, 2015 attention, 2017 transformers, 2022 ChatGPT, 2023 GPT-4/Bard/Claude/Qwen, 2024 GPT-4o/Gemini/Grok, 2025 GPT-5/DeepSeek/Claude 4/Qwen 3).
Savoir définir un agent IA et un prompt, et expliquer leur rôle dans l’automatisation.
Connaître les acteurs et catégories d’acteurs de l’écosystème (généralistes, spécialistes modèles, hardware) et distinguer modèles fermés vs open source.
Savoir décrire le pipeline de construction des modèles : données d’entraînement (pré-traitement, labellisation, vérification), entraînement (calcul, datacenters/GPU), puis inférence (requêtes).
Savoir citer des sources de données d’entraînement mentionnées (Common Crawl, WebText, Books1/Books2, Wikipedia, code/GitHub, données propriétaires) et l’enjeu éthique (transparence, droits d’auteurs, biais).
Savoir expliquer la différence entre comportement centaure et comportement cyborg au niveau de la division du travail (par sous-tâches vs intégration serrée).
Savoir relier les impacts organisationnels à des exemples du cours (performance, transformation des métiers, montée en compétences, centralisation/extraction/synthèse, création de contenus, personnalisation/recommand. ).
Savoir mobiliser les applications marketing vues : relation client (chatbots, suivi réputation), gestion de marque, communication (création/automatisation/KPIs), lead scoring, monitoring social et sentiment.
En recherche en sciences de gestion, savoir définir corpus/document/tokens/bag of words/stylométrie, puis décrire les étapes (corpus → pré-traitements → annotations → analyse) et les familles d’outils (fréquences, annnot
stylométrie) ainsi que l’exemple du QR sur tutoiement singulier vs pluriel (27 615 posts, 25 marques, Twitter/Instagram/Facebook).

📋 Plan du Cours

📖 1. Objectifs du cours et plan général

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 2. IAG, IAA : vocabulaire et paradigmes

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 3. IA mécanique, cognitive, émotionnelle et générative

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 4. Agents IA et prompts pour l’automatisation

🔑 Notions clés & Définitions

📝 Points essentiels

📖 5. Écosystème IA : architecture, acteurs et modèles économiques

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 6. Données numériques : accès, éthique et entraînement

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 7. De l’entraînement à l’inférence et fonctionnement des modèles

🔑 Notions clés & Définitions

📝 Points essentiels

📖 8. Impacts organisationnels et stratégie centaur

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 9. Applications marketing et outils d’IA

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📖 10. IA pour la recherche en sciences de gestion

🔑 Notions clés & Définitions

📝 Points essentiels

💡 Astuce mémo

📅 Repères chronologiques

📊 Tableaux de synthèse

Paradigmes de l’IA (repères)

Types d’IA (données et tâches)

⚠️ Pièges & confusions fréquents

✅ Checklist Examen

Pon a prueba tus conocimientos

Repasa con tarjetas de memoria

Similar courses

Types construits en Python

P-uplets nommés et dictionnaires

Modèle relationnel et normalisation

Réseaux distribués et cloud

Merise et modélisation des données

Programming Language Paradigms

Crea tus propias hojas de repaso

Plan du Cours

1. Objectifs du cours et plan général

Notions clés & Définitions

Points essentiels

Astuce mémo

2. IAG, IAA : vocabulaire et paradigmes

Notions clés & Définitions

Points essentiels

Astuce mémo

3. IA mécanique, cognitive, émotionnelle et générative

Notions clés & Définitions

Points essentiels

Astuce mémo

4. Agents IA et prompts pour l’automatisation

Notions clés & Définitions

Points essentiels

5. Écosystème IA : architecture, acteurs et modèles économiques

Notions clés & Définitions

Points essentiels

Astuce mémo

6. Données numériques : accès, éthique et entraînement

Notions clés & Définitions

Points essentiels

Astuce mémo

7. De l’entraînement à l’inférence et fonctionnement des modèles

Notions clés & Définitions

Points essentiels

8. Impacts organisationnels et stratégie centaur

Notions clés & Définitions

Points essentiels

Astuce mémo

9. Applications marketing et outils d’IA

Notions clés & Définitions

Points essentiels

Astuce mémo

10. IA pour la recherche en sciences de gestion

Notions clés & Définitions

Points essentiels

Astuce mémo

Repères chronologiques

Tableaux de synthèse

Pièges & confusions fréquents

Checklist Examen