Hoja de repaso: Introduction aux fondamentaux de la statistique sociale
📋 Plan du Cours
Définition de la statistique & relation aux faits sociaux
Population & échantillon & représentativité
Variables & caractères & niveaux de mesure
Statistiques descriptives & indicateurs
Médiane & effectifs cumulés
Mode & distribution multimodale
Moyenne & dispersion & variance
Distribution normale & loi de Gauss
Transformation en z & loi normale standard
Table de la loi normale & lecture de z
Distribution de Student & degrés de liberté
Lecture inverse & fractiles & quantiles
📖 1. Définition de la statistique & relation aux faits sociaux
🔑 Notions clés & Définitions
Statistique : Ensemble de données numériques recueillies dans une population ou une sous-population, permettant de synthétiser, analyser et interpréter ces données. Elle peut aussi désigner la science qui étudie ces données et leurs relations.
Faits sociaux : Phénomènes ou comportements collectifs observables dans une société, pouvant être quantifiés et analysés par la statistique.
Population : Ensemble d’individus ou d’objets sur lesquels on souhaite étudier une ou plusieurs caractéristiques. Chaque individu est appelé « individu statistique ».
Échantillon : Sous-ensemble représentatif d’une population, utilisé pour faire des inférences sur cette dernière lorsque l’observation de toute la population est impossible.
Variables statistiques : Caractéristiques mesurées sur chaque individu, pouvant être qualitatives (nominales, ordinales) ou quantitatives (intervalle, ratio).
Niveaux de mesure : Échelles selon lesquelles sont mesurées les variables, déterminant la nature des relations possibles entre les valeurs (nominal, ordinal, intervalle).
📝 Points essentiels
La statistique permet d’obtenir des indications probables sur des ensembles imparfaitement connus, en utilisant des méthodes d’échantillonnage et d’analyse numérique.
La distinction entre population et échantillon est fondamentale : l’échantillon doit être représentatif pour que les résultats soient généralisables.
La validité scientifique d’une étude repose sur la représentativité de l’échantillon et la maîtrise des sources de variabilité (sources prévisibles et imprévisibles).
La statistique n’est pas une science exacte ; elle repose sur la probabilité et sert d’outil d’aide à la décision dans les sciences humaines.
La variabilité des conduites humaines et sociales est à la fois prévisible (dans certains cas) et imprévisible, ce qui rend l’analyse statistique essentielle pour distinguer ces deux types de variations.
Les outils statistiques permettent de vérifier si des différences observées entre groupes ou conditions sont significatives, c’est-à-dire non dues au hasard.
💡 À retenir
La statistique est un outil essentiel en sciences sociales pour analyser la variabilité des faits sociaux, distinguer les variations prévisibles des imprévisibles, et assurer la validité scientifique des conclusions. Elle permet de transformer des données brutes en connaissances exploitables pour comprendre et interpréter les comportements humains et sociaux.
📖 2. Population & échantillon & représentativité
🔑 Notions clés & Définitions
Population : Ensemble d’individus ou d’objets sur lesquels on souhaite étudier une ou plusieurs caractéristiques. Chaque élément est appelé individu statistique.
Échantillon : Sous-ensemble représentatif de la population, choisi pour permettre des observations et des analyses sans devoir étudier toute la population.
Représentativité : Qualité de l’échantillon qui reflète fidèlement les caractéristiques de la population de référence, permettant une généralisation des résultats.
Population finie / infinie : La population est finie si le nombre d’individus est limité, infinie dans le cas d’un ensemble potentiellement illimité ou très grand.
Variables / Caractères : Caractéristiques observées chez chaque individu (ex : âge, sexe, profession).
Statistiques descriptives vs inférentielles : La descriptive décrit l’échantillon, l’inférentielle permet d’estimer ou de conclure sur la population à partir de l’échantillon.
📝 Points essentiels
La validité des résultats dépend de la capacité à constituer un échantillon représentatif.
La sélection de l’échantillon doit respecter la distribution des variables clés de la population (échantillonnage probabiliste).
Il est souvent impossible d’étudier toute la population, surtout si celle-ci est grande ou inaccessible.
La représentativité repose sur la maîtrise des variables pertinentes (ex : âge, sexe, région, niveau socio-professionnel).
La statistique descriptive analyse l’échantillon, tandis que la statistique inférentielle utilise ces analyses pour faire des estimations ou des tests sur la population.
La validité scientifique d’une étude repose sur la qualité de l’échantillonnage et la contrôle des sources de biais.
La variabilité des conduites humaines ou animales nécessite des méthodes statistiques pour distinguer variations prévisibles et imprévisibles.
La réplication des études est essentielle pour confirmer la généralisation des résultats.
💡 À retenir
La représentativité de l’échantillon est essentielle pour que les résultats d’une étude puissent être généralisés à la population de référence ; cela repose sur un choix rigoureux des sujets et une maîtrise des variables clés.
📖 3. Variables & caractères & niveaux de mesure
🔑 Notions clés & Définitions
Variable : Caractéristique mesurable d’un individu ou d’un objet, permettant de décrire ou d’analyser une population ou un échantillon.
Niveau de mesure : Échelle selon laquelle une variable est quantifiée, déterminant la nature des opérations statistiques possibles.
Variable nominale : Variable classant les observations en catégories sans ordre implicite, où seules l’appartenance ou la différence comptent.
Variable ordinale : Variable classant les observations selon un ordre ou une hiérarchie, sans précision sur l’écart entre les rangs.
Variable d’intervalle : Variable où les différences entre valeurs ont un sens précis, avec une échelle graduée, mais sans vrai zéro absolu.
📝 Points essentiels
La variable peut décrire une caractéristique qualitative ou quantitative d’un individu ou groupe.
Les niveaux de mesure déterminent la nature des opérations statistiques possibles :
Nominal : classification sans ordre (ex : couleur, sexe).
Ordinal : classement avec ordre, mais pas d’écart mesurable précis (ex : niveau d’éducation, score d’anxiété).
Intervalle : échelles graduées avec différence significative, mais sans zéro absolu (ex : température en Celsius).
La distinction entre ces niveaux est cruciale pour choisir la méthode d’analyse appropriée.
La représentation numérique (numéros ou codes) dans une variable nominale n’a pas de valeur quantitative, juste une identification.
La relation entre valeurs diffère selon le niveau :
Nominal : égalité ou différence.
Ordinal : ordre, mais pas la magnitude des écarts.
Intervalle : différence significative, possibilité de calculs comme la moyenne.
💡 À retenir
Les niveaux de mesure déterminent la nature des analyses statistiques possibles et leur interprétation ; il est essentiel de bien identifier la nature d’une variable pour choisir la méthode adaptée.
📖 4. Statistiques descriptives & indicateurs
🔑 Notions clés & Définitions
Statistique : Science qui étudie, recueille, traite et interprète des ensembles de données numériques ou qualitatives pour décrire ou analyser des phénomènes.
Population : Ensemble d’individus ou d’objets sur lesquels on souhaite faire une étude ou une observation.
Échantillon : Sous-ensemble représentatif d’une population, choisi pour permettre des inférences sur cette dernière.
Variable : Caractéristique mesurable d’un individu ou d’un objet, pouvant prendre différentes valeurs.
Niveau de mesure : Échelle selon laquelle une variable est mesurée, déterminant la nature des opérations statistiques possibles (nominal, ordinal, intervalle).
Indicateurs statistiques : Nombres ou mesures synthétiques (moyenne, médiane, variance, écart-type) qui résument ou décrivent un ensemble de données.
📝 Points essentiels
La statistique permet d’obtenir des indications probables sur une population à partir d’un échantillon, en utilisant des indicateurs comme la moyenne, la variance, etc.
La distinction entre statistiques descriptives (description de l’échantillon ou de la population) et statistiques inférentielles (estimation ou test sur la population à partir de l’échantillon).
La représentativité de l’échantillon est cruciale : il doit refléter fidèlement la population en termes de caractéristiques (variables pertinentes).
La variabilité des comportements ou des mesures est inévitable ; la statistique aide à distinguer la variabilité prévisible (systématique) de l’imprévisible (aléatoire).
La validité scientifique repose sur la capacité à généraliser les résultats, ce qui nécessite des échantillons bien conçus et répétés.
La statistique est un outil d’aide à la décision dans de nombreux champs en sciences humaines : psychologie, sociologie, éducation, etc.
La différence entre niveaux de mesure :
Nominal : classes sans ordre (ex. couleurs, catégories socio-professionnelles).
Intervalle : variables quantifiables avec écart constant, sans vrai zéro (ex. température en Celsius).
💡 À retenir
La statistique, en sciences humaines, est un outil essentiel pour décrire, analyser et interpréter des données, permettant de distinguer les variations prévisibles des imprévisibles, et d’appuyer la validité des conclusions scientifiques.
📖 5. Médiane & effectifs cumulés
🔑 Notions clés & Définitions
Effectifs : Nombre d’individus ou d’observations dans une classe ou une catégorie. Exemple : Effectif de 150 dans une classe.
Effectifs cumulés : Somme des effectifs des classes ou catégories jusqu’à un certain point, permettant de connaître combien d’individus ont une valeur inférieure ou égale à une valeur donnée.
Médiane : La valeur qui partage un ensemble de données en deux parties égales, c’est-à-dire que 50% des observations sont inférieures ou égales à cette valeur, et 50% supérieures.
Effectifs cumulés relatifs : Pourcentage ou proportion d’individus cumulés par rapport à l’effectif total.
Notion de distribution : Répartition des effectifs ou effectifs cumulés à travers différentes classes ou valeurs.
📝 Points essentiels
La médiane est une mesure de tendance centrale, particulièrement utile pour des distributions asymétriques ou lorsque la moyenne est peu représentative.
Pour déterminer la médiane dans un tableau d’effectifs, on calcule d’abord les effectifs cumulés et on repère la classe où se situe la position médiane (effectif total divisé par 2).
La méthode :
Calculer l’effectif total N.
Trouver la classe où l’effectif cumulé dépasse N/2.
La médiane se trouve dans cette classe.
La formule pour la médiane dans un tableau groupé :
Meˊdiane=L+(f2N−F)×c
où :
L = limite inférieure de la classe médiane,
F = effectif cumulé de la classe précédente,
f = effectif de la classe médiane,
c = amplitude de la classe.
La relation entre effectifs et médiane permet d’analyser la répartition des données, notamment en sciences humaines où la moyenne peut être biaisée par des valeurs extrêmes.
💡 À retenir
La médiane, calculée à partir des effectifs et des effectifs cumulés, est une mesure robuste pour représenter la tendance centrale d’un ensemble de données, surtout lorsque la distribution est asymétrique ou contient des valeurs extrêmes.
📖 6. Mode & distribution multimodale
🔑 Notions clés & Définitions
Distribution multimodale : Une distribution de données présentant plusieurs pics ou maxima, appelés modes, indiquant la présence de plusieurs groupes ou tendances dans les données.
Mode : La valeur ou les valeurs qui apparaissent le plus fréquemment dans un ensemble de données. En distribution multimodale, il y a plusieurs modes.
Distribution unimodale : Distribution avec un seul mode, généralement symétrique ou asymétrique.
Distribution bimodale : Distribution avec deux modes distincts, souvent révélatrice de deux sous-populations ou comportements différents.
Distribution multimodale (au-delà de deux modes) : Distribution présentant plusieurs pics, indiquant une complexité ou la coexistence de plusieurs groupes dans les données.
Points clés : La distribution multimodale peut révéler la présence de sous-groupes ou de comportements variés au sein d’un même ensemble de données, ce qui est essentiel pour l’analyse en sciences humaines.
📝 Points essentiels
La distribution multimodale indique la coexistence de plusieurs tendances ou sous-populations dans un ensemble de données.
La détection de plusieurs modes nécessite une représentation graphique (histogramme, diagramme de fréquence) ou une analyse statistique spécifique.
La présence de plusieurs modes peut signaler des phénomènes complexes, comme des comportements différenciés selon des variables sociales, démographiques ou psychologiques.
La compréhension de la distribution multimodale permet d’éviter les interprétations erronées qui pourraient découler d’une analyse basée uniquement sur des mesures centrales (moyenne, médiane).
La distribution multimodale est courante en sciences humaines, où les comportements ou opinions peuvent se regrouper en plusieurs catégories distinctes.
💡 À retenir
La distribution multimodale révèle la coexistence de plusieurs groupes ou tendances dans les données, ce qui est crucial pour une analyse fine des phénomènes sociaux ou comportementaux. Elle nécessite une représentation graphique ou une analyse statistique adaptée pour être correctement interprétée.
📖 7. Moyenne & dispersion & variance
🔑 Notions clés & Définitions
Moyenne arithmétique : Somme de toutes les valeurs d’un ensemble divisée par le nombre de valeurs. Elle représente la tendance centrale d’un jeu de données.
Dispersion : Mesure de la variabilité ou de la dispersion des données autour de la moyenne. Elle indique à quel point les valeurs sont dispersées ou concentrées.
Variance : Moyenne des carrés des écarts à la moyenne. Elle quantifie la dispersion des données, avec une unité au carré des unités originales.
Écart-type : Racine carrée de la variance. Il donne une mesure de dispersion dans les mêmes unités que les données.
Point à retenir : La moyenne donne une idée de la valeur centrale, tandis que la variance et l’écart-type renseignent sur la dispersion des données autour de cette moyenne.
📝 Points essentiels
La moyenne est sensible aux valeurs extrêmes (outliers), ce qui peut fausser l’interprétation.
La variance est calculée en faisant la moyenne des carrés des écarts à la moyenne, ce qui accentue l’impact des écarts importants.
L’écart-type, étant dans la même unité que les données, facilite l’interprétation de la dispersion.
La formule de la variance pour un échantillon (s²) : s2=n−11∑i=1n(xi−xˉ)2
La formule de la variance pour une population (σ²) : σ2=N1∑i=1N(xi−μ)2
La dispersion permet d’évaluer la fiabilité des estimations statistiques : une faible dispersion indique une estimation plus précise.
La variance et l’écart-type sont utilisés pour comparer la variabilité entre différents ensembles de données.
💡 À retenir
La moyenne synthétise la tendance centrale, tandis que la variance et l’écart-type mesurent la dispersion, permettant d’évaluer la fiabilité et la variabilité des données. Ces mesures sont fondamentales pour analyser et interpréter les résultats en sciences humaines.
📖 8. Distribution normale & loi de Gauss
🔑 Notions clés & Définitions
Distribution normale (ou loi de Gauss) : Fonction de densité de probabilité continue en forme de courbe en cloche, symétrique par rapport à la moyenne, décrivant la répartition de nombreuses variables naturelles ou expérimentales.
Courbe en cloche : Représentation graphique de la distribution normale, caractérisée par sa moyenne (μ) et son écart-type (σ).
Moyenne (μ) : Valeur centrale autour de laquelle sont regroupées les données, point d’équilibre de la distribution.
Écart-type (σ) : Mesure de la dispersion ou de la variabilité des données par rapport à la moyenne.
Points clés :
68% des données se trouvent à moins d’un écart-type de la moyenne.
95% à moins de deux écarts-types.
99,7% à moins de trois écarts-types (règle empirique ou règle des 3σ).
Notion de standardisation : Transformation d’une variable en score Z pour comparer différentes distributions, en soustrayant la moyenne et en divisant par l’écart-type.
📝 Points essentiels
La distribution normale est omniprésente en sciences humaines, notamment pour modéliser des phénomènes naturels, sociaux ou psychologiques.
La loi de Gauss est symétrique, unimodale (un seul sommet) et sa queue s’étire indéfiniment.
La fonction de densité de la distribution normale est donnée par : f(x)=σ2π1e−2σ2(x−μ)2
La règle empirique permet d’estimer la proportion de données dans certains intervalles autour de la moyenne.
La standardisation (score Z) : Z=σX−μ
permet de comparer des valeurs issues de distributions différentes.
💡 À retenir
La distribution normale est une modélisation fondamentale en statistiques, permettant d’interpréter et de comparer des données continues grâce à ses propriétés symétriques et à la règle des écarts-types, facilitant ainsi la prise de décision et l’analyse des phénomènes aléatoires.
📖 9. Transformation en z & loi normale standard
🔑 Notions clés & Définitions
Transformation en z : Opération mathématique qui convertit une variable aléatoire X en une variable standardisée Z, permettant de comparer des distributions différentes. La formule est : Z=σX−μ
où μ est la moyenne et σ l’écart-type de la distribution de X.
Loi normale standard (ou loi normale centrée réduite) : Distribution normale avec une moyenne μ=0 et un écart-type σ=1. Elle sert de référence pour toutes les autres distributions normales après transformation en z.
Notion de standardisation : Processus de transformation d’une variable pour qu’elle suive une loi normale standard, facilitant la comparaison et l’utilisation des tables de la loi normale.
Table de la loi normale : Outil permettant de connaître la probabilité qu’une variable Z standardisée prenne une valeur inférieure ou égale à un certain seuil.
Points à retenir : La transformation en z permet de normaliser une distribution, rendant possible l’utilisation des tables de la loi normale pour calculer des probabilités.
📝 Points essentiels
La transformation en z est essentielle pour analyser des variables suivant une loi normale ou approximée par celle-ci, notamment pour calculer des probabilités ou effectuer des tests statistiques.
La formule de transformation : Z=σX−μ
permet de convertir une valeur X en une valeur Z standardisée.
La loi normale standard possède une courbe en cloche symétrique, avec une moyenne de 0 et un écart-type de 1.
La table de la loi normale fournit la probabilité que Z soit inférieur ou égal à une valeur donnée, facilitant ainsi l’évaluation de la position d’une observation dans la distribution.
La transformation en z est un outil clé pour la réalisation de tests statistiques tels que le test z, permettant de déterminer si une observation est significativement différente d’une moyenne hypothétique.
La loi normale est souvent utilisée comme modèle pour de nombreux phénomènes en sciences humaines, notamment en psychologie et sociologie, en raison de ses propriétés mathématiques.
💡 À retenir
La transformation en z standardise une variable pour exploiter la loi normale standard, permettant de calculer facilement des probabilités et d’effectuer des analyses statistiques comparatives. Elle constitue un fondement essentiel pour l’inférence statistique en sciences humaines.
📖 10. Table de la loi normale & lecture de z
🔑 Notions clés & Définitions
Loi normale (ou distribution normale) : Distribution de probabilité continue en forme de courbe en cloche, symétrique autour de la moyenne, décrivant de nombreux phénomènes naturels et sociaux.
Variable standardisée (z-score) : Variable aléatoire normalisée, calculée par la formule z = (X - μ) / σ, permettant de comparer des valeurs issues de distributions différentes.
Table de la loi normale : Tableau permettant de connaître la probabilité qu’une variable normale standardisée z soit inférieure ou égale à une valeur donnée.
Lecture de z : Processus d’utilisation de la table pour déterminer la probabilité associée à une valeur z ou inversement, pour retrouver la valeur z correspondant à une probabilité donnée.
Point à retenir : La table de la loi normale facilite l’interprétation des scores z en fournissant rapidement la probabilité cumulative associée, essentielle pour l’analyse statistique inférentielle.
📝 Points essentiels
La loi normale est caractérisée par sa moyenne μ et son écart type σ ; la distribution est symétrique et en forme de cloche.
La transformation en z-score permet de standardiser n’importe quelle variable pour utiliser la table de la loi normale.
La table donne la probabilité que Z soit inférieur ou égal à une valeur z (probabilité cumulative).
Pour une valeur z positive, la probabilité correspond à la surface sous la courbe à gauche de z ; pour une valeur négative, on utilise la symétrie de la courbe.
La lecture inverse permet de retrouver la valeur z correspondant à une probabilité donnée (par exemple, pour déterminer un seuil de rejet dans un test statistique).
La règle empirique (68-95-99,7) s’appuie sur la loi normale : 68% des valeurs sont à ±1σ, 95% à ±2σ, et 99,7% à ±3σ de la moyenne.
💡 À retenir
La table de la loi normale est un outil fondamental pour convertir des scores en probabilités et effectuer des analyses statistiques inférentielles, en permettant de situer une valeur dans la distribution et d’évaluer la significativité des résultats.
📖 11. Distribution de Student & degrés de liberté
🔑 Notions clés & Définitions
Distribution de Student : Loi de probabilité utilisée pour estimer la moyenne d’une population lorsque l’échantillon est petit et que la variance de la population est inconnue. Elle permet de réaliser des tests d’hypothèses sur la moyenne.
Degrés de liberté (dl) : Nombre de valeurs indépendantes dans un calcul statistique, généralement égal à la taille de l’échantillon moins le nombre de paramètres estimés (ex. n - 1 pour la moyenne). Ils déterminent la forme de la distribution de Student.
Test t de Student : Test statistique permettant de comparer la moyenne d’un échantillon à une valeur hypothétique ou de comparer deux moyennes d’échantillons indépendants ou appariés.
Hypothèse nulle (H0) : Affirmation à tester, généralement qu’il n’y a pas de différence ou d’effet (ex. moyenne égale à une valeur donnée).
Valeur critique : Seuil déterminé par la distribution de Student pour décider de rejeter ou non H0, en fonction du niveau de signification (α).
📝 Points essentiels
La distribution de Student est utilisée lorsque la taille de l’échantillon est petite (généralement n < 30) et que la variance de la population est inconnue.
Elle dépend du nombre de degrés de liberté, qui influence la forme de la courbe : plus le dl est faible, plus la distribution est étalée.
Le test t compare la statistique t calculée à la valeur critique pour déterminer si la différence observée est statistiquement significative.
La formule du t pour un échantillon : t=s/nxˉ−μ0
où xˉ est la moyenne de l’échantillon, μ0 la moyenne hypothétique, s l’écart type de l’échantillon, et n la taille de l’échantillon.
La valeur de t suit une distribution de Student avec n−1 degrés de liberté.
La critique du test t : sensible à la normalité de la distribution, surtout pour petits échantillons.
💡 À retenir
La distribution de Student, caractérisée par ses degrés de liberté, est essentielle pour réaliser des tests de moyenne fiables avec de petits échantillons, permettant d’évaluer si une différence observée est statistiquement significative ou due au hasard.
📖 12. Lecture inverse & fractiles & quantiles
🔑 Notions clés & Définitions
Fractiles : valeurs qui divisent un ensemble de données en parties égales, permettant de repérer la position relative d'une observation dans une distribution. Exemple : quartiles, déciles, percentiles.
Quantiles : points de coupure d'une distribution qui partagent l'ensemble des données en intervalles de même probabilité. Les fractiles sont un type de quantiles.
Lecture inverse : méthode permettant de retrouver une valeur de donnée à partir de sa position dans une distribution, en utilisant les fractiles ou quantiles.
Les fractiles : valeurs qui segmentent une distribution en parties égales (ex : quartile divise en 4, décile en 10, percentile en 100).
Les points à retenir : Les fractiles et quantiles sont essentiels pour analyser la position relative d'une donnée dans une distribution, facilitant la comparaison entre différentes populations ou échantillons.
📝 Points essentiels
Les fractiles permettent de diviser une distribution en segments égaux, facilitant la lecture et l'interprétation des données.
La lecture inverse consiste à déterminer la valeur d'une variable à partir de sa position dans la distribution, en utilisant les fractiles ou quantiles.
Les quartiles (Q1, Q2, Q3) sont des fractiles qui divisent une distribution en quatre parties égales, où Q2 correspond à la médiane.
Les déciles divisent la distribution en 10 parties égales, et les percentiles en 100.
La relation entre fractiles et quantiles : tous les fractiles sont des quantiles, mais tous les quantiles ne sont pas nécessairement des fractiles (selon la division choisie).
La lecture inverse est utile pour estimer une valeur spécifique dans une distribution à partir de sa position relative (ex : déterminer le score correspondant au 90e percentile).
La méthode de calcul des quantiles dépend de la taille de l’échantillon et de la technique de interpolation utilisée.
💡 À retenir
Les fractiles et quantiles sont des outils fondamentaux pour analyser la position relative d’une donnée dans une distribution, permettant une lecture inverse efficace et une comparaison précise entre différentes populations ou échantillons.
📊 Tableaux de Synthèse
Critère
Population
Échantillon
Représentativité
Variables & Niveaux de Mesure
Définition
Ensemble complet d’individus ou objets
Sous-ensemble choisi pour étude
Capacité à refléter la population
Caractéristiques mesurées (qualitatives ou quantitatives)
Taille
Peut être très grande ou infinie
Plus petite, limitée
Essentielle pour généraliser
Nominal, ordinal, intervalle, ratio
Objectif
Analyse globale
Estimation ou inférence
Garantir la validité des résultats
Choix dépend du type de variable
Représentativité
N/A
Critère clé
Crucial pour la validité scientifique
Dépend de la méthode d’échantillonnage
Critère
Variables & Caractères
Niveaux de Mesure
Statistiques Descriptives & Indicateurs
Définition
Caractéristiques mesurées sur individus
Échelles de mesure (nominal, ordinal, intervalle, ratio)
Moyenne, médiane, mode, variance, écart-type
Nature
Qualitative ou quantitative
Définissent la nature des opérations statistiques possibles
Confondre population et échantillon, surtout en termes de représentativité.
Négliger l’importance du mode de sélection pour assurer la représentativité.
Confondre variable nominale et ordinale, notamment dans l’analyse.
Utiliser la moyenne pour des variables ordinales ou nominales.
Interpréter à tort la dispersion comme une absence de variabilité.
Confondre distribution normale et loi de Gauss, ou croire qu’elle s’applique à toutes les données.
Mal interpréter la transformation en z, en pensant qu’elle modifie la distribution.
Confondre la table de la loi normale avec la distribution elle-même.
Utiliser la distribution de Student sans ajuster les degrés de liberté.
Mal lire les fractiles ou quantiles, en confondant leur position dans la distribution.
✅ Checklist Examen
Définir la statistique et expliquer sa relation avec les faits sociaux.
Distinguer population et échantillon, et préciser l’importance de la représentativité.
Identifier le niveau de mesure d’une variable (nominal, ordinal, intervalle, ratio).
Expliquer la différence entre statistiques descriptives et inférentielles.
Définir la médiane, mode, moyenne, et leur rôle dans la synthèse des données.
Calculer et interpréter la variance et l’écart-type.
Décrire la distribution normale et la loi de Gauss.
Expliquer la transformation en z et ses applications.
Lire une table de la loi normale pour déterminer une probabilité ou un fractile.
Définir la distribution de Student et préciser l’impact des degrés de liberté.
Calculer et interpréter un quantile ou un fractile dans une distribution.
Comprendre l’usage des fractiles pour la segmentation ou la classification des données.
Pon a prueba tus conocimientos
Pon a prueba tus conocimientos sobre Introduction aux fondamentaux de la statistique sociale con 9 preguntas de opción múltiple con correcciones detalladas.
1. Quelle est la définition de la statistique et quelle est sa relation avec les faits sociaux?
2. Que désigne le terme 'statistique' selon la définition donnée dans le cours ?