Revision sheet: Introduction aux fondamentaux de la statistique sociale

📋 Plan du Cours

  1. Définition de la statistique & relation aux faits sociaux
  2. Population & échantillon & représentativité
  3. Variables & caractĂšres & niveaux de mesure
  4. Statistiques descriptives & indicateurs
  5. Médiane & effectifs cumulés
  6. Mode & distribution multimodale
  7. Moyenne & dispersion & variance
  8. Distribution normale & loi de Gauss
  9. Transformation en z & loi normale standard
  10. Table de la loi normale & lecture de z
  11. Distribution de Student & degrés de liberté
  12. Lecture inverse & fractiles & quantiles

📖 1. DĂ©finition de la statistique & relation aux faits sociaux

🔑 Notions clĂ©s & DĂ©finitions

  • Statistique : Ensemble de donnĂ©es numĂ©riques recueillies dans une population ou une sous-population, permettant de synthĂ©tiser, analyser et interprĂ©ter ces donnĂ©es. Elle peut aussi dĂ©signer la science qui Ă©tudie ces donnĂ©es et leurs relations.
  • Faits sociaux : PhĂ©nomĂšnes ou comportements collectifs observables dans une sociĂ©tĂ©, pouvant ĂȘtre quantifiĂ©s et analysĂ©s par la statistique.
  • Population : Ensemble d’individus ou d’objets sur lesquels on souhaite Ă©tudier une ou plusieurs caractĂ©ristiques. Chaque individu est appelĂ© « individu statistique ».
  • Échantillon : Sous-ensemble reprĂ©sentatif d’une population, utilisĂ© pour faire des infĂ©rences sur cette derniĂšre lorsque l’observation de toute la population est impossible.
  • Variables statistiques : CaractĂ©ristiques mesurĂ©es sur chaque individu, pouvant ĂȘtre qualitatives (nominales, ordinales) ou quantitatives (intervalle, ratio).
  • Niveaux de mesure : Échelles selon lesquelles sont mesurĂ©es les variables, dĂ©terminant la nature des relations possibles entre les valeurs (nominal, ordinal, intervalle).

📝 Points essentiels

  • La statistique permet d’obtenir des indications probables sur des ensembles imparfaitement connus, en utilisant des mĂ©thodes d’échantillonnage et d’analyse numĂ©rique.
  • La distinction entre population et Ă©chantillon est fondamentale : l’échantillon doit ĂȘtre reprĂ©sentatif pour que les rĂ©sultats soient gĂ©nĂ©ralisables.
  • La validitĂ© scientifique d’une Ă©tude repose sur la reprĂ©sentativitĂ© de l’échantillon et la maĂźtrise des sources de variabilitĂ© (sources prĂ©visibles et imprĂ©visibles).
  • La statistique n’est pas une science exacte ; elle repose sur la probabilitĂ© et sert d’outil d’aide Ă  la dĂ©cision dans les sciences humaines.
  • La variabilitĂ© des conduites humaines et sociales est Ă  la fois prĂ©visible (dans certains cas) et imprĂ©visible, ce qui rend l’analyse statistique essentielle pour distinguer ces deux types de variations.
  • Les outils statistiques permettent de vĂ©rifier si des diffĂ©rences observĂ©es entre groupes ou conditions sont significatives, c’est-Ă -dire non dues au hasard.

💡 À retenir

La statistique est un outil essentiel en sciences sociales pour analyser la variabilité des faits sociaux, distinguer les variations prévisibles des imprévisibles, et assurer la validité scientifique des conclusions. Elle permet de transformer des données brutes en connaissances exploitables pour comprendre et interpréter les comportements humains et sociaux.

📖 2. Population & Ă©chantillon & reprĂ©sentativitĂ©

🔑 Notions clĂ©s & DĂ©finitions

  • Population : Ensemble d’individus ou d’objets sur lesquels on souhaite Ă©tudier une ou plusieurs caractĂ©ristiques. Chaque Ă©lĂ©ment est appelĂ© individu statistique.
  • Échantillon : Sous-ensemble reprĂ©sentatif de la population, choisi pour permettre des observations et des analyses sans devoir Ă©tudier toute la population.
  • ReprĂ©sentativitĂ© : QualitĂ© de l’échantillon qui reflĂšte fidĂšlement les caractĂ©ristiques de la population de rĂ©fĂ©rence, permettant une gĂ©nĂ©ralisation des rĂ©sultats.
  • Population finie / infinie : La population est finie si le nombre d’individus est limitĂ©, infinie dans le cas d’un ensemble potentiellement illimitĂ© ou trĂšs grand.
  • Variables / CaractĂšres : CaractĂ©ristiques observĂ©es chez chaque individu (ex : Ăąge, sexe, profession).
  • Statistiques descriptives vs infĂ©rentielles : La descriptive dĂ©crit l’échantillon, l’infĂ©rentielle permet d’estimer ou de conclure sur la population Ă  partir de l’échantillon.

📝 Points essentiels

  • La validitĂ© des rĂ©sultats dĂ©pend de la capacitĂ© Ă  constituer un Ă©chantillon reprĂ©sentatif.
  • La sĂ©lection de l’échantillon doit respecter la distribution des variables clĂ©s de la population (Ă©chantillonnage probabiliste).
  • Il est souvent impossible d’étudier toute la population, surtout si celle-ci est grande ou inaccessible.
  • La reprĂ©sentativitĂ© repose sur la maĂźtrise des variables pertinentes (ex : Ăąge, sexe, rĂ©gion, niveau socio-professionnel).
  • La statistique descriptive analyse l’échantillon, tandis que la statistique infĂ©rentielle utilise ces analyses pour faire des estimations ou des tests sur la population.
  • La validitĂ© scientifique d’une Ă©tude repose sur la qualitĂ© de l’échantillonnage et la contrĂŽle des sources de biais.
  • La variabilitĂ© des conduites humaines ou animales nĂ©cessite des mĂ©thodes statistiques pour distinguer variations prĂ©visibles et imprĂ©visibles.
  • La rĂ©plication des Ă©tudes est essentielle pour confirmer la gĂ©nĂ©ralisation des rĂ©sultats.

💡 À retenir

La reprĂ©sentativitĂ© de l’échantillon est essentielle pour que les rĂ©sultats d’une Ă©tude puissent ĂȘtre gĂ©nĂ©ralisĂ©s Ă  la population de rĂ©fĂ©rence ; cela repose sur un choix rigoureux des sujets et une maĂźtrise des variables clĂ©s.

📖 3. Variables & caractùres & niveaux de mesure

🔑 Notions clĂ©s & DĂ©finitions

  • Variable : CaractĂ©ristique mesurable d’un individu ou d’un objet, permettant de dĂ©crire ou d’analyser une population ou un Ă©chantillon.
  • Niveau de mesure : Échelle selon laquelle une variable est quantifiĂ©e, dĂ©terminant la nature des opĂ©rations statistiques possibles.
  • Variable nominale : Variable classant les observations en catĂ©gories sans ordre implicite, oĂč seules l’appartenance ou la diffĂ©rence comptent.
  • Variable ordinale : Variable classant les observations selon un ordre ou une hiĂ©rarchie, sans prĂ©cision sur l’écart entre les rangs.
  • Variable d’intervalle : Variable oĂč les diffĂ©rences entre valeurs ont un sens prĂ©cis, avec une Ă©chelle graduĂ©e, mais sans vrai zĂ©ro absolu.

📝 Points essentiels

  • La variable peut dĂ©crire une caractĂ©ristique qualitative ou quantitative d’un individu ou groupe.
  • Les niveaux de mesure dĂ©terminent la nature des opĂ©rations statistiques possibles :
    • Nominal : classification sans ordre (ex : couleur, sexe).
    • Ordinal : classement avec ordre, mais pas d’écart mesurable prĂ©cis (ex : niveau d’éducation, score d’anxiĂ©tĂ©).
    • Intervalle : Ă©chelles graduĂ©es avec diffĂ©rence significative, mais sans zĂ©ro absolu (ex : tempĂ©rature en Celsius).
  • La distinction entre ces niveaux est cruciale pour choisir la mĂ©thode d’analyse appropriĂ©e.
  • La reprĂ©sentation numĂ©rique (numĂ©ros ou codes) dans une variable nominale n’a pas de valeur quantitative, juste une identification.
  • La relation entre valeurs diffĂšre selon le niveau :
    • Nominal : Ă©galitĂ© ou diffĂ©rence.
    • Ordinal : ordre, mais pas la magnitude des Ă©carts.
    • Intervalle : diffĂ©rence significative, possibilitĂ© de calculs comme la moyenne.

💡 À retenir

Les niveaux de mesure dĂ©terminent la nature des analyses statistiques possibles et leur interprĂ©tation ; il est essentiel de bien identifier la nature d’une variable pour choisir la mĂ©thode adaptĂ©e.

📖 4. Statistiques descriptives & indicateurs

🔑 Notions clĂ©s & DĂ©finitions

  • Statistique : Science qui Ă©tudie, recueille, traite et interprĂšte des ensembles de donnĂ©es numĂ©riques ou qualitatives pour dĂ©crire ou analyser des phĂ©nomĂšnes.
  • Population : Ensemble d’individus ou d’objets sur lesquels on souhaite faire une Ă©tude ou une observation.
  • Échantillon : Sous-ensemble reprĂ©sentatif d’une population, choisi pour permettre des infĂ©rences sur cette derniĂšre.
  • Variable : CaractĂ©ristique mesurable d’un individu ou d’un objet, pouvant prendre diffĂ©rentes valeurs.
  • Niveau de mesure : Échelle selon laquelle une variable est mesurĂ©e, dĂ©terminant la nature des opĂ©rations statistiques possibles (nominal, ordinal, intervalle).
  • Indicateurs statistiques : Nombres ou mesures synthĂ©tiques (moyenne, mĂ©diane, variance, Ă©cart-type) qui rĂ©sument ou dĂ©crivent un ensemble de donnĂ©es.

📝 Points essentiels

  • La statistique permet d’obtenir des indications probables sur une population Ă  partir d’un Ă©chantillon, en utilisant des indicateurs comme la moyenne, la variance, etc.
  • La distinction entre statistiques descriptives (description de l’échantillon ou de la population) et statistiques infĂ©rentielles (estimation ou test sur la population Ă  partir de l’échantillon).
  • La reprĂ©sentativitĂ© de l’échantillon est cruciale : il doit reflĂ©ter fidĂšlement la population en termes de caractĂ©ristiques (variables pertinentes).
  • La variabilitĂ© des comportements ou des mesures est inĂ©vitable ; la statistique aide Ă  distinguer la variabilitĂ© prĂ©visible (systĂ©matique) de l’imprĂ©visible (alĂ©atoire).
  • La validitĂ© scientifique repose sur la capacitĂ© Ă  gĂ©nĂ©raliser les rĂ©sultats, ce qui nĂ©cessite des Ă©chantillons bien conçus et rĂ©pĂ©tĂ©s.
  • La statistique est un outil d’aide Ă  la dĂ©cision dans de nombreux champs en sciences humaines : psychologie, sociologie, Ă©ducation, etc.
  • La diffĂ©rence entre niveaux de mesure :
    • Nominal : classes sans ordre (ex. couleurs, catĂ©gories socio-professionnelles).
    • Ordinal : classes ordonnĂ©es sans quantification prĂ©cise (ex. niveaux scolaires, scores d’anxiĂ©tĂ©).
    • Intervalle : variables quantifiables avec Ă©cart constant, sans vrai zĂ©ro (ex. tempĂ©rature en Celsius).

💡 À retenir

La statistique, en sciences humaines, est un outil essentiel pour dĂ©crire, analyser et interprĂ©ter des donnĂ©es, permettant de distinguer les variations prĂ©visibles des imprĂ©visibles, et d’appuyer la validitĂ© des conclusions scientifiques.

📖 5. MĂ©diane & effectifs cumulĂ©s

🔑 Notions clĂ©s & DĂ©finitions

  • Effectifs : Nombre d’individus ou d’observations dans une classe ou une catĂ©gorie. Exemple : Effectif de 150 dans une classe.
  • Effectifs cumulĂ©s : Somme des effectifs des classes ou catĂ©gories jusqu’à un certain point, permettant de connaĂźtre combien d’individus ont une valeur infĂ©rieure ou Ă©gale Ă  une valeur donnĂ©e.
  • MĂ©diane : La valeur qui partage un ensemble de donnĂ©es en deux parties Ă©gales, c’est-Ă -dire que 50% des observations sont infĂ©rieures ou Ă©gales Ă  cette valeur, et 50% supĂ©rieures.
  • Effectifs cumulĂ©s relatifs : Pourcentage ou proportion d’individus cumulĂ©s par rapport Ă  l’effectif total.
  • Notion de distribution : RĂ©partition des effectifs ou effectifs cumulĂ©s Ă  travers diffĂ©rentes classes ou valeurs.

📝 Points essentiels

  • La mĂ©diane est une mesure de tendance centrale, particuliĂšrement utile pour des distributions asymĂ©triques ou lorsque la moyenne est peu reprĂ©sentative.

  • Pour dĂ©terminer la mĂ©diane dans un tableau d’effectifs, on calcule d’abord les effectifs cumulĂ©s et on repĂšre la classe oĂč se situe la position mĂ©diane (effectif total divisĂ© par 2).

  • La mĂ©thode :

    1. Calculer l’effectif total NN.
    2. Trouver la classe oĂč l’effectif cumulĂ© dĂ©passe N/2N/2.
    3. La médiane se trouve dans cette classe.
  • La formule pour la mĂ©diane dans un tableau groupĂ© :

    Meˊdiane=L+(N2−Ff)×c\text{MĂ©diane} = L + \left( \frac{\frac{N}{2} - F}{f} \right) \times c

    oĂč :

    • LL = limite infĂ©rieure de la classe mĂ©diane,
    • FF = effectif cumulĂ© de la classe prĂ©cĂ©dente,
    • ff = effectif de la classe mĂ©diane,
    • cc = amplitude de la classe.
  • La relation entre effectifs et mĂ©diane permet d’analyser la rĂ©partition des donnĂ©es, notamment en sciences humaines oĂč la moyenne peut ĂȘtre biaisĂ©e par des valeurs extrĂȘmes.

💡 À retenir

La mĂ©diane, calculĂ©e Ă  partir des effectifs et des effectifs cumulĂ©s, est une mesure robuste pour reprĂ©senter la tendance centrale d’un ensemble de donnĂ©es, surtout lorsque la distribution est asymĂ©trique ou contient des valeurs extrĂȘmes.

📖 6. Mode & distribution multimodale

🔑 Notions clĂ©s & DĂ©finitions

  • Distribution multimodale : Une distribution de donnĂ©es prĂ©sentant plusieurs pics ou maxima, appelĂ©s modes, indiquant la prĂ©sence de plusieurs groupes ou tendances dans les donnĂ©es.
  • Mode : La valeur ou les valeurs qui apparaissent le plus frĂ©quemment dans un ensemble de donnĂ©es. En distribution multimodale, il y a plusieurs modes.
  • Distribution unimodale : Distribution avec un seul mode, gĂ©nĂ©ralement symĂ©trique ou asymĂ©trique.
  • Distribution bimodale : Distribution avec deux modes distincts, souvent rĂ©vĂ©latrice de deux sous-populations ou comportements diffĂ©rents.
  • Distribution multimodale (au-delĂ  de deux modes) : Distribution prĂ©sentant plusieurs pics, indiquant une complexitĂ© ou la coexistence de plusieurs groupes dans les donnĂ©es.
  • Points clĂ©s : La distribution multimodale peut rĂ©vĂ©ler la prĂ©sence de sous-groupes ou de comportements variĂ©s au sein d’un mĂȘme ensemble de donnĂ©es, ce qui est essentiel pour l’analyse en sciences humaines.

📝 Points essentiels

  • La distribution multimodale indique la coexistence de plusieurs tendances ou sous-populations dans un ensemble de donnĂ©es.
  • La dĂ©tection de plusieurs modes nĂ©cessite une reprĂ©sentation graphique (histogramme, diagramme de frĂ©quence) ou une analyse statistique spĂ©cifique.
  • La prĂ©sence de plusieurs modes peut signaler des phĂ©nomĂšnes complexes, comme des comportements diffĂ©renciĂ©s selon des variables sociales, dĂ©mographiques ou psychologiques.
  • La comprĂ©hension de la distribution multimodale permet d’éviter les interprĂ©tations erronĂ©es qui pourraient dĂ©couler d’une analyse basĂ©e uniquement sur des mesures centrales (moyenne, mĂ©diane).
  • La distribution multimodale est courante en sciences humaines, oĂč les comportements ou opinions peuvent se regrouper en plusieurs catĂ©gories distinctes.

💡 À retenir

La distribution multimodale rĂ©vĂšle la coexistence de plusieurs groupes ou tendances dans les donnĂ©es, ce qui est crucial pour une analyse fine des phĂ©nomĂšnes sociaux ou comportementaux. Elle nĂ©cessite une reprĂ©sentation graphique ou une analyse statistique adaptĂ©e pour ĂȘtre correctement interprĂ©tĂ©e.

📖 7. Moyenne & dispersion & variance

🔑 Notions clĂ©s & DĂ©finitions

  • Moyenne arithmĂ©tique : Somme de toutes les valeurs d’un ensemble divisĂ©e par le nombre de valeurs. Elle reprĂ©sente la tendance centrale d’un jeu de donnĂ©es.
  • Dispersion : Mesure de la variabilitĂ© ou de la dispersion des donnĂ©es autour de la moyenne. Elle indique Ă  quel point les valeurs sont dispersĂ©es ou concentrĂ©es.
  • Variance : Moyenne des carrĂ©s des Ă©carts Ă  la moyenne. Elle quantifie la dispersion des donnĂ©es, avec une unitĂ© au carrĂ© des unitĂ©s originales.
  • Écart-type : Racine carrĂ©e de la variance. Il donne une mesure de dispersion dans les mĂȘmes unitĂ©s que les donnĂ©es.
  • Point Ă  retenir : La moyenne donne une idĂ©e de la valeur centrale, tandis que la variance et l’écart-type renseignent sur la dispersion des donnĂ©es autour de cette moyenne.

📝 Points essentiels

  • La moyenne est sensible aux valeurs extrĂȘmes (outliers), ce qui peut fausser l’interprĂ©tation.
  • La variance est calculĂ©e en faisant la moyenne des carrĂ©s des Ă©carts Ă  la moyenne, ce qui accentue l’impact des Ă©carts importants.
  • L’écart-type, Ă©tant dans la mĂȘme unitĂ© que les donnĂ©es, facilite l’interprĂ©tation de la dispersion.
  • La formule de la variance pour un Ă©chantillon (sÂČ) :
    s2=1n−1∑i=1n(xi−xˉ)2s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2
  • La formule de la variance pour une population (σÂČ) :
    σ2=1N∑i=1N(xi−Ό)2\sigma^2 = \frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2
  • La dispersion permet d’évaluer la fiabilitĂ© des estimations statistiques : une faible dispersion indique une estimation plus prĂ©cise.
  • La variance et l’écart-type sont utilisĂ©s pour comparer la variabilitĂ© entre diffĂ©rents ensembles de donnĂ©es.

💡 À retenir

La moyenne synthĂ©tise la tendance centrale, tandis que la variance et l’écart-type mesurent la dispersion, permettant d’évaluer la fiabilitĂ© et la variabilitĂ© des donnĂ©es. Ces mesures sont fondamentales pour analyser et interprĂ©ter les rĂ©sultats en sciences humaines.

📖 8. Distribution normale & loi de Gauss

🔑 Notions clĂ©s & DĂ©finitions

  • Distribution normale (ou loi de Gauss) : Fonction de densitĂ© de probabilitĂ© continue en forme de courbe en cloche, symĂ©trique par rapport Ă  la moyenne, dĂ©crivant la rĂ©partition de nombreuses variables naturelles ou expĂ©rimentales.
  • Courbe en cloche : ReprĂ©sentation graphique de la distribution normale, caractĂ©risĂ©e par sa moyenne (ÎŒ) et son Ă©cart-type (σ).
  • Moyenne (ÎŒ) : Valeur centrale autour de laquelle sont regroupĂ©es les donnĂ©es, point d’équilibre de la distribution.
  • Écart-type (σ) : Mesure de la dispersion ou de la variabilitĂ© des donnĂ©es par rapport Ă  la moyenne.
  • Points clĂ©s :
    • 68% des donnĂ©es se trouvent Ă  moins d’un Ă©cart-type de la moyenne.
    • 95% Ă  moins de deux Ă©carts-types.
    • 99,7% Ă  moins de trois Ă©carts-types (rĂšgle empirique ou rĂšgle des 3σ).
  • Notion de standardisation : Transformation d’une variable en score Z pour comparer diffĂ©rentes distributions, en soustrayant la moyenne et en divisant par l’écart-type.

📝 Points essentiels

  • La distribution normale est omniprĂ©sente en sciences humaines, notamment pour modĂ©liser des phĂ©nomĂšnes naturels, sociaux ou psychologiques.
  • La loi de Gauss est symĂ©trique, unimodale (un seul sommet) et sa queue s’étire indĂ©finiment.
  • La fonction de densitĂ© de la distribution normale est donnĂ©e par :
    f(x)=1σ2πe−(x−Ό)22σ2f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}
  • La rĂšgle empirique permet d’estimer la proportion de donnĂ©es dans certains intervalles autour de la moyenne.
  • La standardisation (score Z) :
    Z=X−ΌσZ = \frac{X - \mu}{\sigma} permet de comparer des valeurs issues de distributions diffĂ©rentes.

💡 À retenir

La distribution normale est une modĂ©lisation fondamentale en statistiques, permettant d’interprĂ©ter et de comparer des donnĂ©es continues grĂące Ă  ses propriĂ©tĂ©s symĂ©triques et Ă  la rĂšgle des Ă©carts-types, facilitant ainsi la prise de dĂ©cision et l’analyse des phĂ©nomĂšnes alĂ©atoires.

📖 9. Transformation en z & loi normale standard

🔑 Notions clĂ©s & DĂ©finitions

  • Transformation en z : OpĂ©ration mathĂ©matique qui convertit une variable alĂ©atoire X en une variable standardisĂ©e Z, permettant de comparer des distributions diffĂ©rentes. La formule est :
    Z=X−ΌσZ = \frac{X - \mu}{\sigma}
    oĂč ÎŒ\mu est la moyenne et σ\sigma l’écart-type de la distribution de X.

  • Loi normale standard (ou loi normale centrĂ©e rĂ©duite) : Distribution normale avec une moyenne ÎŒ=0\mu=0 et un Ă©cart-type σ=1\sigma=1. Elle sert de rĂ©fĂ©rence pour toutes les autres distributions normales aprĂšs transformation en z.

  • Notion de standardisation : Processus de transformation d’une variable pour qu’elle suive une loi normale standard, facilitant la comparaison et l’utilisation des tables de la loi normale.

  • Table de la loi normale : Outil permettant de connaĂźtre la probabilitĂ© qu’une variable Z standardisĂ©e prenne une valeur infĂ©rieure ou Ă©gale Ă  un certain seuil.

  • Points Ă  retenir : La transformation en z permet de normaliser une distribution, rendant possible l’utilisation des tables de la loi normale pour calculer des probabilitĂ©s.

📝 Points essentiels

  • La transformation en z est essentielle pour analyser des variables suivant une loi normale ou approximĂ©e par celle-ci, notamment pour calculer des probabilitĂ©s ou effectuer des tests statistiques.

  • La formule de transformation :
    Z=X−ΌσZ = \frac{X - \mu}{\sigma}
    permet de convertir une valeur X en une valeur Z standardisée.

  • La loi normale standard possĂšde une courbe en cloche symĂ©trique, avec une moyenne de 0 et un Ă©cart-type de 1.

  • La table de la loi normale fournit la probabilitĂ© que Z soit infĂ©rieur ou Ă©gal Ă  une valeur donnĂ©e, facilitant ainsi l’évaluation de la position d’une observation dans la distribution.

  • La transformation en z est un outil clĂ© pour la rĂ©alisation de tests statistiques tels que le test z, permettant de dĂ©terminer si une observation est significativement diffĂ©rente d’une moyenne hypothĂ©tique.

  • La loi normale est souvent utilisĂ©e comme modĂšle pour de nombreux phĂ©nomĂšnes en sciences humaines, notamment en psychologie et sociologie, en raison de ses propriĂ©tĂ©s mathĂ©matiques.

💡 À retenir

La transformation en z standardise une variable pour exploiter la loi normale standard, permettant de calculer facilement des probabilitĂ©s et d’effectuer des analyses statistiques comparatives. Elle constitue un fondement essentiel pour l’infĂ©rence statistique en sciences humaines.

📖 10. Table de la loi normale & lecture de z

🔑 Notions clĂ©s & DĂ©finitions

  • Loi normale (ou distribution normale) : Distribution de probabilitĂ© continue en forme de courbe en cloche, symĂ©trique autour de la moyenne, dĂ©crivant de nombreux phĂ©nomĂšnes naturels et sociaux.
  • Variable standardisĂ©e (z-score) : Variable alĂ©atoire normalisĂ©e, calculĂ©e par la formule z = (X - ÎŒ) / σ, permettant de comparer des valeurs issues de distributions diffĂ©rentes.
  • Table de la loi normale : Tableau permettant de connaĂźtre la probabilitĂ© qu’une variable normale standardisĂ©e z soit infĂ©rieure ou Ă©gale Ă  une valeur donnĂ©e.
  • Lecture de z : Processus d’utilisation de la table pour dĂ©terminer la probabilitĂ© associĂ©e Ă  une valeur z ou inversement, pour retrouver la valeur z correspondant Ă  une probabilitĂ© donnĂ©e.
  • Point Ă  retenir : La table de la loi normale facilite l’interprĂ©tation des scores z en fournissant rapidement la probabilitĂ© cumulative associĂ©e, essentielle pour l’analyse statistique infĂ©rentielle.

📝 Points essentiels

  • La loi normale est caractĂ©risĂ©e par sa moyenne ÎŒ et son Ă©cart type σ ; la distribution est symĂ©trique et en forme de cloche.
  • La transformation en z-score permet de standardiser n’importe quelle variable pour utiliser la table de la loi normale.
  • La table donne la probabilitĂ© que Z soit infĂ©rieur ou Ă©gal Ă  une valeur z (probabilitĂ© cumulative).
  • Pour une valeur z positive, la probabilitĂ© correspond Ă  la surface sous la courbe Ă  gauche de z ; pour une valeur nĂ©gative, on utilise la symĂ©trie de la courbe.
  • La lecture inverse permet de retrouver la valeur z correspondant Ă  une probabilitĂ© donnĂ©e (par exemple, pour dĂ©terminer un seuil de rejet dans un test statistique).
  • La rĂšgle empirique (68-95-99,7) s’appuie sur la loi normale : 68% des valeurs sont Ă  ±1σ, 95% Ă  ±2σ, et 99,7% Ă  ±3σ de la moyenne.

💡 À retenir

La table de la loi normale est un outil fondamental pour convertir des scores en probabilitĂ©s et effectuer des analyses statistiques infĂ©rentielles, en permettant de situer une valeur dans la distribution et d’évaluer la significativitĂ© des rĂ©sultats.

📖 11. Distribution de Student & degrĂ©s de libertĂ©

🔑 Notions clĂ©s & DĂ©finitions

  • Distribution de Student : Loi de probabilitĂ© utilisĂ©e pour estimer la moyenne d’une population lorsque l’échantillon est petit et que la variance de la population est inconnue. Elle permet de rĂ©aliser des tests d’hypothĂšses sur la moyenne.
  • DegrĂ©s de libertĂ© (dl) : Nombre de valeurs indĂ©pendantes dans un calcul statistique, gĂ©nĂ©ralement Ă©gal Ă  la taille de l’échantillon moins le nombre de paramĂštres estimĂ©s (ex. n - 1 pour la moyenne). Ils dĂ©terminent la forme de la distribution de Student.
  • Test t de Student : Test statistique permettant de comparer la moyenne d’un Ă©chantillon Ă  une valeur hypothĂ©tique ou de comparer deux moyennes d’échantillons indĂ©pendants ou appariĂ©s.
  • HypothĂšse nulle (H0) : Affirmation Ă  tester, gĂ©nĂ©ralement qu’il n’y a pas de diffĂ©rence ou d’effet (ex. moyenne Ă©gale Ă  une valeur donnĂ©e).
  • Valeur critique : Seuil dĂ©terminĂ© par la distribution de Student pour dĂ©cider de rejeter ou non H0, en fonction du niveau de signification (α).

📝 Points essentiels

  • La distribution de Student est utilisĂ©e lorsque la taille de l’échantillon est petite (gĂ©nĂ©ralement n < 30) et que la variance de la population est inconnue.
  • Elle dĂ©pend du nombre de degrĂ©s de libertĂ©, qui influence la forme de la courbe : plus le dl est faible, plus la distribution est Ă©talĂ©e.
  • Le test t compare la statistique t calculĂ©e Ă  la valeur critique pour dĂ©terminer si la diffĂ©rence observĂ©e est statistiquement significative.
  • La formule du t pour un Ă©chantillon :
    t=xˉ−Ό0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} oĂč xˉ\bar{x} est la moyenne de l’échantillon, ÎŒ0\mu_0 la moyenne hypothĂ©tique, ss l’écart type de l’échantillon, et nn la taille de l’échantillon.
  • La valeur de t suit une distribution de Student avec n−1n-1 degrĂ©s de libertĂ©.
  • La critique du test t : sensible Ă  la normalitĂ© de la distribution, surtout pour petits Ă©chantillons.

💡 À retenir

La distribution de Student, caractĂ©risĂ©e par ses degrĂ©s de libertĂ©, est essentielle pour rĂ©aliser des tests de moyenne fiables avec de petits Ă©chantillons, permettant d’évaluer si une diffĂ©rence observĂ©e est statistiquement significative ou due au hasard.

📖 12. Lecture inverse & fractiles & quantiles

🔑 Notions clĂ©s & DĂ©finitions

  • Fractiles : valeurs qui divisent un ensemble de donnĂ©es en parties Ă©gales, permettant de repĂ©rer la position relative d'une observation dans une distribution. Exemple : quartiles, dĂ©ciles, percentiles.
  • Quantiles : points de coupure d'une distribution qui partagent l'ensemble des donnĂ©es en intervalles de mĂȘme probabilitĂ©. Les fractiles sont un type de quantiles.
  • Lecture inverse : mĂ©thode permettant de retrouver une valeur de donnĂ©e Ă  partir de sa position dans une distribution, en utilisant les fractiles ou quantiles.
  • Les fractiles : valeurs qui segmentent une distribution en parties Ă©gales (ex : quartile divise en 4, dĂ©cile en 10, percentile en 100).
  • Les points Ă  retenir : Les fractiles et quantiles sont essentiels pour analyser la position relative d'une donnĂ©e dans une distribution, facilitant la comparaison entre diffĂ©rentes populations ou Ă©chantillons.

📝 Points essentiels

  • Les fractiles permettent de diviser une distribution en segments Ă©gaux, facilitant la lecture et l'interprĂ©tation des donnĂ©es.
  • La lecture inverse consiste Ă  dĂ©terminer la valeur d'une variable Ă  partir de sa position dans la distribution, en utilisant les fractiles ou quantiles.
  • Les quartiles (Q1, Q2, Q3) sont des fractiles qui divisent une distribution en quatre parties Ă©gales, oĂč Q2 correspond Ă  la mĂ©diane.
  • Les dĂ©ciles divisent la distribution en 10 parties Ă©gales, et les percentiles en 100.
  • La relation entre fractiles et quantiles : tous les fractiles sont des quantiles, mais tous les quantiles ne sont pas nĂ©cessairement des fractiles (selon la division choisie).
  • La lecture inverse est utile pour estimer une valeur spĂ©cifique dans une distribution Ă  partir de sa position relative (ex : dĂ©terminer le score correspondant au 90e percentile).
  • La mĂ©thode de calcul des quantiles dĂ©pend de la taille de l’échantillon et de la technique de interpolation utilisĂ©e.

💡 À retenir

Les fractiles et quantiles sont des outils fondamentaux pour analyser la position relative d’une donnĂ©e dans une distribution, permettant une lecture inverse efficace et une comparaison prĂ©cise entre diffĂ©rentes populations ou Ă©chantillons.

📊 Tableaux de Synthùse

CritĂšrePopulationÉchantillonReprĂ©sentativitĂ©Variables & Niveaux de Mesure
DĂ©finitionEnsemble complet d’individus ou objetsSous-ensemble choisi pour Ă©tudeCapacitĂ© Ă  reflĂ©ter la populationCaractĂ©ristiques mesurĂ©es (qualitatives ou quantitatives)
TaillePeut ĂȘtre trĂšs grande ou infiniePlus petite, limitĂ©eEssentielle pour gĂ©nĂ©raliserNominal, ordinal, intervalle, ratio
ObjectifAnalyse globaleEstimation ou inférenceGarantir la validité des résultatsChoix dépend du type de variable
ReprĂ©sentativitĂ©N/ACritĂšre clĂ©Crucial pour la validitĂ© scientifiqueDĂ©pend de la mĂ©thode d’échantillonnage
CritĂšreVariables & CaractĂšresNiveaux de MesureStatistiques Descriptives & Indicateurs
DĂ©finitionCaractĂ©ristiques mesurĂ©es sur individusÉchelles de mesure (nominal, ordinal, intervalle, ratio)Moyenne, mĂ©diane, mode, variance, Ă©cart-type
NatureQualitative ou quantitativeDéfinissent la nature des opérations statistiques possiblesRésument ou décrivent les données
ExempleÂge, sexe, niveau d’éducationNominal (sexe), ordinal (niveau), intervalle (tempĂ©rature)Moyenne (Ăąge), mĂ©diane, mode, dispersion
ImportanceGuide le choix de l’analyseDĂ©termine la mĂ©thode statistique appropriĂ©ePermet une synthĂšse efficace des donnĂ©es

⚠ PiĂšges & Confusions FrĂ©quentes

  1. Confondre population et échantillon, surtout en termes de représentativité.
  2. NĂ©gliger l’importance du mode de sĂ©lection pour assurer la reprĂ©sentativitĂ©.
  3. Confondre variable nominale et ordinale, notamment dans l’analyse.
  4. Utiliser la moyenne pour des variables ordinales ou nominales.
  5. Interpréter à tort la dispersion comme une absence de variabilité.
  6. Confondre distribution normale et loi de Gauss, ou croire qu’elle s’applique Ă  toutes les donnĂ©es.
  7. Mal interprĂ©ter la transformation en z, en pensant qu’elle modifie la distribution.
  8. Confondre la table de la loi normale avec la distribution elle-mĂȘme.
  9. Utiliser la distribution de Student sans ajuster les degrés de liberté.
  10. Mal lire les fractiles ou quantiles, en confondant leur position dans la distribution.

✅ Checklist Examen

  1. Définir la statistique et expliquer sa relation avec les faits sociaux.
  2. Distinguer population et Ă©chantillon, et prĂ©ciser l’importance de la reprĂ©sentativitĂ©.
  3. Identifier le niveau de mesure d’une variable (nominal, ordinal, intervalle, ratio).
  4. Expliquer la différence entre statistiques descriptives et inférentielles.
  5. Définir la médiane, mode, moyenne, et leur rÎle dans la synthÚse des données.
  6. Calculer et interprĂ©ter la variance et l’écart-type.
  7. Décrire la distribution normale et la loi de Gauss.
  8. Expliquer la transformation en z et ses applications.
  9. Lire une table de la loi normale pour déterminer une probabilité ou un fractile.
  10. DĂ©finir la distribution de Student et prĂ©ciser l’impact des degrĂ©s de libertĂ©.
  11. Calculer et interpréter un quantile ou un fractile dans une distribution.
  12. Comprendre l’usage des fractiles pour la segmentation ou la classification des donnĂ©es.

Test your knowledge

Test your knowledge on Introduction aux fondamentaux de la statistique sociale with 9 multiple-choice questions with detailed corrections.

1. Quelle est la définition de la statistique et quelle est sa relation avec les faits sociaux?

2. Que désigne le terme 'statistique' selon la définition donnée dans le cours ?

Take the quiz →

Review with flashcards

Memorize the key concepts of Introduction aux fondamentaux de la statistique sociale with 10 interactive flashcards.

Statistique — dĂ©finition ?

Ensemble de données ou science qui les étudie.

Statistique — dĂ©finition?

Ensemble de données numériques et leur étude.

Faits sociaux — rîle ?

PhénomÚnes collectifs analysés par la statistique.

See flashcards →

Similar courses

Create your own revision sheets

Import your course and AI generates sheets, quizzes and flashcards in 30 seconds.

Sheet generator