đ Plan du Cours
Définition de la statistique & relation aux faits sociaux
Population & échantillon & représentativité
Variables & caractĂšres & niveaux de mesure
Statistiques descriptives & indicateurs
Médiane & effectifs cumulés
Mode & distribution multimodale
Moyenne & dispersion & variance
Distribution normale & loi de Gauss
Transformation en z & loi normale standard
Table de la loi normale & lecture de z
Distribution de Student & degrés de liberté
Lecture inverse & fractiles & quantiles
đ 1. DĂ©finition de la statistique & relation aux faits sociaux
đ Notions clĂ©s & DĂ©finitions
Statistique : Ensemble de données numériques recueillies dans une population ou une sous-population, permettant de synthétiser, analyser et interpréter ces données. Elle peut aussi désigner la science qui étudie ces données et leurs relations.
Faits sociaux : PhĂ©nomĂšnes ou comportements collectifs observables dans une sociĂ©tĂ©, pouvant ĂȘtre quantifiĂ©s et analysĂ©s par la statistique.
Population : Ensemble dâindividus ou dâobjets sur lesquels on souhaite Ă©tudier une ou plusieurs caractĂ©ristiques. Chaque individu est appelĂ© « individu statistique ».
Ăchantillon : Sous-ensemble reprĂ©sentatif dâune population, utilisĂ© pour faire des infĂ©rences sur cette derniĂšre lorsque lâobservation de toute la population est impossible.
Variables statistiques : CaractĂ©ristiques mesurĂ©es sur chaque individu, pouvant ĂȘtre qualitatives (nominales, ordinales) ou quantitatives (intervalle, ratio).
Niveaux de mesure : Ăchelles selon lesquelles sont mesurĂ©es les variables, dĂ©terminant la nature des relations possibles entre les valeurs (nominal, ordinal, intervalle).
đ Points essentiels
La statistique permet dâobtenir des indications probables sur des ensembles imparfaitement connus, en utilisant des mĂ©thodes dâĂ©chantillonnage et dâanalyse numĂ©rique.
La distinction entre population et Ă©chantillon est fondamentale : lâĂ©chantillon doit ĂȘtre reprĂ©sentatif pour que les rĂ©sultats soient gĂ©nĂ©ralisables.
La validitĂ© scientifique dâune Ă©tude repose sur la reprĂ©sentativitĂ© de lâĂ©chantillon et la maĂźtrise des sources de variabilitĂ© (sources prĂ©visibles et imprĂ©visibles).
La statistique nâest pas une science exacte ; elle repose sur la probabilitĂ© et sert dâoutil dâaide Ă la dĂ©cision dans les sciences humaines.
La variabilitĂ© des conduites humaines et sociales est Ă la fois prĂ©visible (dans certains cas) et imprĂ©visible, ce qui rend lâanalyse statistique essentielle pour distinguer ces deux types de variations.
Les outils statistiques permettent de vĂ©rifier si des diffĂ©rences observĂ©es entre groupes ou conditions sont significatives, câest-Ă -dire non dues au hasard.
đĄ Ă retenir
La statistique est un outil essentiel en sciences sociales pour analyser la variabilité des faits sociaux, distinguer les variations prévisibles des imprévisibles, et assurer la validité scientifique des conclusions. Elle permet de transformer des données brutes en connaissances exploitables pour comprendre et interpréter les comportements humains et sociaux.
đ 2. Population & Ă©chantillon & reprĂ©sentativitĂ©
đ Notions clĂ©s & DĂ©finitions
Population : Ensemble dâindividus ou dâobjets sur lesquels on souhaite Ă©tudier une ou plusieurs caractĂ©ristiques. Chaque Ă©lĂ©ment est appelĂ© individu statistique .
Ăchantillon : Sous-ensemble reprĂ©sentatif de la population, choisi pour permettre des observations et des analyses sans devoir Ă©tudier toute la population.
ReprĂ©sentativitĂ© : QualitĂ© de lâĂ©chantillon qui reflĂšte fidĂšlement les caractĂ©ristiques de la population de rĂ©fĂ©rence, permettant une gĂ©nĂ©ralisation des rĂ©sultats.
Population finie / infinie : La population est finie si le nombre dâindividus est limitĂ©, infinie dans le cas dâun ensemble potentiellement illimitĂ© ou trĂšs grand.
Variables / CaractÚres : Caractéristiques observées chez chaque individu (ex : ùge, sexe, profession).
Statistiques descriptives vs infĂ©rentielles : La descriptive dĂ©crit lâĂ©chantillon, lâinfĂ©rentielle permet dâestimer ou de conclure sur la population Ă partir de lâĂ©chantillon.
đ Points essentiels
La validité des résultats dépend de la capacité à constituer un échantillon représentatif.
La sĂ©lection de lâĂ©chantillon doit respecter la distribution des variables clĂ©s de la population (Ă©chantillonnage probabiliste).
Il est souvent impossible dâĂ©tudier toute la population, surtout si celle-ci est grande ou inaccessible.
La représentativité repose sur la maßtrise des variables pertinentes (ex : ùge, sexe, région, niveau socio-professionnel).
La statistique descriptive analyse lâĂ©chantillon, tandis que la statistique infĂ©rentielle utilise ces analyses pour faire des estimations ou des tests sur la population.
La validitĂ© scientifique dâune Ă©tude repose sur la qualitĂ© de lâĂ©chantillonnage et la contrĂŽle des sources de biais.
La variabilité des conduites humaines ou animales nécessite des méthodes statistiques pour distinguer variations prévisibles et imprévisibles.
La réplication des études est essentielle pour confirmer la généralisation des résultats.
đĄ Ă retenir
La reprĂ©sentativitĂ© de lâĂ©chantillon est essentielle pour que les rĂ©sultats dâune Ă©tude puissent ĂȘtre gĂ©nĂ©ralisĂ©s Ă la population de rĂ©fĂ©rence ; cela repose sur un choix rigoureux des sujets et une maĂźtrise des variables clĂ©s.
đ 3. Variables & caractĂšres & niveaux de mesure
đ Notions clĂ©s & DĂ©finitions
Variable : CaractĂ©ristique mesurable dâun individu ou dâun objet, permettant de dĂ©crire ou dâanalyser une population ou un Ă©chantillon.
Niveau de mesure : Ăchelle selon laquelle une variable est quantifiĂ©e, dĂ©terminant la nature des opĂ©rations statistiques possibles.
Variable nominale : Variable classant les observations en catĂ©gories sans ordre implicite, oĂč seules lâappartenance ou la diffĂ©rence comptent.
Variable ordinale : Variable classant les observations selon un ordre ou une hiĂ©rarchie, sans prĂ©cision sur lâĂ©cart entre les rangs.
Variable dâintervalle : Variable oĂč les diffĂ©rences entre valeurs ont un sens prĂ©cis, avec une Ă©chelle graduĂ©e, mais sans vrai zĂ©ro absolu.
đ Points essentiels
La variable peut dĂ©crire une caractĂ©ristique qualitative ou quantitative dâun individu ou groupe.
Les niveaux de mesure déterminent la nature des opérations statistiques possibles :
Nominal : classification sans ordre (ex : couleur, sexe).
Ordinal : classement avec ordre, mais pas dâĂ©cart mesurable prĂ©cis (ex : niveau dâĂ©ducation, score dâanxiĂ©tĂ©).
Intervalle : échelles graduées avec différence significative, mais sans zéro absolu (ex : température en Celsius).
La distinction entre ces niveaux est cruciale pour choisir la mĂ©thode dâanalyse appropriĂ©e.
La reprĂ©sentation numĂ©rique (numĂ©ros ou codes) dans une variable nominale nâa pas de valeur quantitative, juste une identification.
La relation entre valeurs diffĂšre selon le niveau :
Nominal : égalité ou différence.
Ordinal : ordre, mais pas la magnitude des écarts.
Intervalle : différence significative, possibilité de calculs comme la moyenne.
đĄ Ă retenir
Les niveaux de mesure dĂ©terminent la nature des analyses statistiques possibles et leur interprĂ©tation ; il est essentiel de bien identifier la nature dâune variable pour choisir la mĂ©thode adaptĂ©e.
đ 4. Statistiques descriptives & indicateurs
đ Notions clĂ©s & DĂ©finitions
Statistique : Science qui étudie, recueille, traite et interprÚte des ensembles de données numériques ou qualitatives pour décrire ou analyser des phénomÚnes.
Population : Ensemble dâindividus ou dâobjets sur lesquels on souhaite faire une Ă©tude ou une observation.
Ăchantillon : Sous-ensemble reprĂ©sentatif dâune population, choisi pour permettre des infĂ©rences sur cette derniĂšre.
Variable : CaractĂ©ristique mesurable dâun individu ou dâun objet, pouvant prendre diffĂ©rentes valeurs.
Niveau de mesure : Ăchelle selon laquelle une variable est mesurĂ©e, dĂ©terminant la nature des opĂ©rations statistiques possibles (nominal, ordinal, intervalle).
Indicateurs statistiques : Nombres ou mesures synthétiques (moyenne, médiane, variance, écart-type) qui résument ou décrivent un ensemble de données.
đ Points essentiels
La statistique permet dâobtenir des indications probables sur une population Ă partir dâun Ă©chantillon, en utilisant des indicateurs comme la moyenne, la variance, etc.
La distinction entre statistiques descriptives (description de lâĂ©chantillon ou de la population) et statistiques infĂ©rentielles (estimation ou test sur la population Ă partir de lâĂ©chantillon).
La reprĂ©sentativitĂ© de lâĂ©chantillon est cruciale : il doit reflĂ©ter fidĂšlement la population en termes de caractĂ©ristiques (variables pertinentes).
La variabilitĂ© des comportements ou des mesures est inĂ©vitable ; la statistique aide Ă distinguer la variabilitĂ© prĂ©visible (systĂ©matique) de lâimprĂ©visible (alĂ©atoire).
La validité scientifique repose sur la capacité à généraliser les résultats, ce qui nécessite des échantillons bien conçus et répétés.
La statistique est un outil dâaide Ă la dĂ©cision dans de nombreux champs en sciences humaines : psychologie, sociologie, Ă©ducation, etc.
La différence entre niveaux de mesure :
Nominal : classes sans ordre (ex. couleurs, catégories socio-professionnelles).
Ordinal : classes ordonnĂ©es sans quantification prĂ©cise (ex. niveaux scolaires, scores dâanxiĂ©tĂ©).
Intervalle : variables quantifiables avec écart constant, sans vrai zéro (ex. température en Celsius).
đĄ Ă retenir
La statistique, en sciences humaines, est un outil essentiel pour dĂ©crire, analyser et interprĂ©ter des donnĂ©es, permettant de distinguer les variations prĂ©visibles des imprĂ©visibles, et dâappuyer la validitĂ© des conclusions scientifiques.
đ 5. MĂ©diane & effectifs cumulĂ©s
đ Notions clĂ©s & DĂ©finitions
Effectifs : Nombre dâindividus ou dâobservations dans une classe ou une catĂ©gorie. Exemple : Effectif de 150 dans une classe.
Effectifs cumulĂ©s : Somme des effectifs des classes ou catĂ©gories jusquâĂ un certain point, permettant de connaĂźtre combien dâindividus ont une valeur infĂ©rieure ou Ă©gale Ă une valeur donnĂ©e.
MĂ©diane : La valeur qui partage un ensemble de donnĂ©es en deux parties Ă©gales, câest-Ă -dire que 50% des observations sont infĂ©rieures ou Ă©gales Ă cette valeur, et 50% supĂ©rieures.
Effectifs cumulĂ©s relatifs : Pourcentage ou proportion dâindividus cumulĂ©s par rapport Ă lâeffectif total.
Notion de distribution : Répartition des effectifs ou effectifs cumulés à travers différentes classes ou valeurs.
đ Points essentiels
La médiane est une mesure de tendance centrale, particuliÚrement utile pour des distributions asymétriques ou lorsque la moyenne est peu représentative.
Pour dĂ©terminer la mĂ©diane dans un tableau dâeffectifs, on calcule dâabord les effectifs cumulĂ©s et on repĂšre la classe oĂč se situe la position mĂ©diane (effectif total divisĂ© par 2).
La méthode :
Calculer lâeffectif total N N N .
Trouver la classe oĂč lâeffectif cumulĂ© dĂ©passe N / 2 N/2 N /2 .
La médiane se trouve dans cette classe.
La formule pour la médiane dans un tableau groupé :
M e Ë diane = L + ( N 2 â F f ) Ă c \text{MĂ©diane} = L + \left( \frac{\frac{N}{2} - F}{f} \right) \times c M e Ë diane = L + ( f 2 N â â F â ) Ă c
oĂč :
L L L = limite inférieure de la classe médiane,
F F F = effectif cumulé de la classe précédente,
f f f = effectif de la classe médiane,
c c c = amplitude de la classe.
La relation entre effectifs et mĂ©diane permet dâanalyser la rĂ©partition des donnĂ©es, notamment en sciences humaines oĂč la moyenne peut ĂȘtre biaisĂ©e par des valeurs extrĂȘmes.
đĄ Ă retenir
La mĂ©diane, calculĂ©e Ă partir des effectifs et des effectifs cumulĂ©s, est une mesure robuste pour reprĂ©senter la tendance centrale dâun ensemble de donnĂ©es, surtout lorsque la distribution est asymĂ©trique ou contient des valeurs extrĂȘmes.
đ 6. Mode & distribution multimodale
đ Notions clĂ©s & DĂ©finitions
Distribution multimodale : Une distribution de données présentant plusieurs pics ou maxima, appelés modes, indiquant la présence de plusieurs groupes ou tendances dans les données.
Mode : La valeur ou les valeurs qui apparaissent le plus fréquemment dans un ensemble de données. En distribution multimodale, il y a plusieurs modes.
Distribution unimodale : Distribution avec un seul mode, généralement symétrique ou asymétrique.
Distribution bimodale : Distribution avec deux modes distincts, souvent révélatrice de deux sous-populations ou comportements différents.
Distribution multimodale (au-delà de deux modes) : Distribution présentant plusieurs pics, indiquant une complexité ou la coexistence de plusieurs groupes dans les données.
Points clĂ©s : La distribution multimodale peut rĂ©vĂ©ler la prĂ©sence de sous-groupes ou de comportements variĂ©s au sein dâun mĂȘme ensemble de donnĂ©es, ce qui est essentiel pour lâanalyse en sciences humaines.
đ Points essentiels
La distribution multimodale indique la coexistence de plusieurs tendances ou sous-populations dans un ensemble de données.
La détection de plusieurs modes nécessite une représentation graphique (histogramme, diagramme de fréquence) ou une analyse statistique spécifique.
La présence de plusieurs modes peut signaler des phénomÚnes complexes, comme des comportements différenciés selon des variables sociales, démographiques ou psychologiques.
La comprĂ©hension de la distribution multimodale permet dâĂ©viter les interprĂ©tations erronĂ©es qui pourraient dĂ©couler dâune analyse basĂ©e uniquement sur des mesures centrales (moyenne, mĂ©diane).
La distribution multimodale est courante en sciences humaines, oĂč les comportements ou opinions peuvent se regrouper en plusieurs catĂ©gories distinctes.
đĄ Ă retenir
La distribution multimodale rĂ©vĂšle la coexistence de plusieurs groupes ou tendances dans les donnĂ©es, ce qui est crucial pour une analyse fine des phĂ©nomĂšnes sociaux ou comportementaux. Elle nĂ©cessite une reprĂ©sentation graphique ou une analyse statistique adaptĂ©e pour ĂȘtre correctement interprĂ©tĂ©e.
đ 7. Moyenne & dispersion & variance
đ Notions clĂ©s & DĂ©finitions
Moyenne arithmĂ©tique : Somme de toutes les valeurs dâun ensemble divisĂ©e par le nombre de valeurs. Elle reprĂ©sente la tendance centrale dâun jeu de donnĂ©es.
Dispersion : Mesure de la variabilité ou de la dispersion des données autour de la moyenne. Elle indique à quel point les valeurs sont dispersées ou concentrées.
Variance : Moyenne des carrés des écarts à la moyenne. Elle quantifie la dispersion des données, avec une unité au carré des unités originales.
Ăcart-type : Racine carrĂ©e de la variance. Il donne une mesure de dispersion dans les mĂȘmes unitĂ©s que les donnĂ©es.
Point Ă retenir : La moyenne donne une idĂ©e de la valeur centrale, tandis que la variance et lâĂ©cart-type renseignent sur la dispersion des donnĂ©es autour de cette moyenne.
đ Points essentiels
La moyenne est sensible aux valeurs extrĂȘmes (outliers), ce qui peut fausser lâinterprĂ©tation.
La variance est calculĂ©e en faisant la moyenne des carrĂ©s des Ă©carts Ă la moyenne, ce qui accentue lâimpact des Ă©carts importants.
LâĂ©cart-type, Ă©tant dans la mĂȘme unitĂ© que les donnĂ©es, facilite lâinterprĂ©tation de la dispersion.
La formule de la variance pour un Ă©chantillon (sÂČ) :
s 2 = 1 n â 1 â i = 1 n ( x i â x Ë ) 2 s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2 s 2 = n â 1 1 â â i = 1 n â ( x i â â x Ë ) 2
La formule de la variance pour une population (ÏÂČ) :
Ï 2 = 1 N â i = 1 N ( x i â ÎŒ ) 2 \sigma^2 = \frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2 Ï 2 = N 1 â â i = 1 N â ( x i â â ÎŒ ) 2
La dispersion permet dâĂ©valuer la fiabilitĂ© des estimations statistiques : une faible dispersion indique une estimation plus prĂ©cise.
La variance et lâĂ©cart-type sont utilisĂ©s pour comparer la variabilitĂ© entre diffĂ©rents ensembles de donnĂ©es.
đĄ Ă retenir
La moyenne synthĂ©tise la tendance centrale, tandis que la variance et lâĂ©cart-type mesurent la dispersion, permettant dâĂ©valuer la fiabilitĂ© et la variabilitĂ© des donnĂ©es. Ces mesures sont fondamentales pour analyser et interprĂ©ter les rĂ©sultats en sciences humaines.
đ 8. Distribution normale & loi de Gauss
đ Notions clĂ©s & DĂ©finitions
Distribution normale (ou loi de Gauss) : Fonction de densité de probabilité continue en forme de courbe en cloche, symétrique par rapport à la moyenne, décrivant la répartition de nombreuses variables naturelles ou expérimentales.
Courbe en cloche : ReprĂ©sentation graphique de la distribution normale, caractĂ©risĂ©e par sa moyenne (ÎŒ) et son Ă©cart-type (Ï).
Moyenne (ÎŒ) : Valeur centrale autour de laquelle sont regroupĂ©es les donnĂ©es, point dâĂ©quilibre de la distribution.
Ăcart-type (Ï) : Mesure de la dispersion ou de la variabilitĂ© des donnĂ©es par rapport Ă la moyenne.
Points clés :
68% des donnĂ©es se trouvent Ă moins dâun Ă©cart-type de la moyenne.
95% à moins de deux écarts-types.
99,7% Ă moins de trois Ă©carts-types (rĂšgle empirique ou rĂšgle des 3Ï).
Notion de standardisation : Transformation dâune variable en score Z pour comparer diffĂ©rentes distributions, en soustrayant la moyenne et en divisant par lâĂ©cart-type.
đ Points essentiels
La distribution normale est omniprésente en sciences humaines, notamment pour modéliser des phénomÚnes naturels, sociaux ou psychologiques.
La loi de Gauss est symĂ©trique, unimodale (un seul sommet) et sa queue sâĂ©tire indĂ©finiment.
La fonction de densité de la distribution normale est donnée par :
f ( x ) = 1 Ï 2 Ï e â ( x â ÎŒ ) 2 2 Ï 2 f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f ( x ) = Ï 2 Ï â 1 â e â 2 Ï 2 ( x â ÎŒ ) 2 â
La rĂšgle empirique permet dâestimer la proportion de donnĂ©es dans certains intervalles autour de la moyenne.
La standardisation (score Z) :
Z = X â ÎŒ Ï Z = \frac{X - \mu}{\sigma} Z = Ï X â ÎŒ â
permet de comparer des valeurs issues de distributions différentes.
đĄ Ă retenir
La distribution normale est une modĂ©lisation fondamentale en statistiques, permettant dâinterprĂ©ter et de comparer des donnĂ©es continues grĂące Ă ses propriĂ©tĂ©s symĂ©triques et Ă la rĂšgle des Ă©carts-types, facilitant ainsi la prise de dĂ©cision et lâanalyse des phĂ©nomĂšnes alĂ©atoires.
đ Notions clĂ©s & DĂ©finitions
Transformation en z : Opération mathématique qui convertit une variable aléatoire X en une variable standardisée Z, permettant de comparer des distributions différentes. La formule est :
Z = X â ÎŒ Ï Z = \frac{X - \mu}{\sigma} Z = Ï X â ÎŒ â
oĂč ÎŒ \mu ÎŒ est la moyenne et Ï \sigma Ï lâĂ©cart-type de la distribution de X.
Loi normale standard (ou loi normale centrĂ©e rĂ©duite) : Distribution normale avec une moyenne ÎŒ = 0 \mu=0 ÎŒ = 0 et un Ă©cart-type Ï = 1 \sigma=1 Ï = 1 . Elle sert de rĂ©fĂ©rence pour toutes les autres distributions normales aprĂšs transformation en z.
Notion de standardisation : Processus de transformation dâune variable pour quâelle suive une loi normale standard, facilitant la comparaison et lâutilisation des tables de la loi normale.
Table de la loi normale : Outil permettant de connaĂźtre la probabilitĂ© quâune variable Z standardisĂ©e prenne une valeur infĂ©rieure ou Ă©gale Ă un certain seuil.
Points Ă retenir : La transformation en z permet de normaliser une distribution, rendant possible lâutilisation des tables de la loi normale pour calculer des probabilitĂ©s.
đ Points essentiels
La transformation en z est essentielle pour analyser des variables suivant une loi normale ou approximée par celle-ci, notamment pour calculer des probabilités ou effectuer des tests statistiques.
La formule de transformation :
Z = X â ÎŒ Ï Z = \frac{X - \mu}{\sigma} Z = Ï X â ÎŒ â
permet de convertir une valeur X en une valeur Z standardisée.
La loi normale standard possÚde une courbe en cloche symétrique, avec une moyenne de 0 et un écart-type de 1.
La table de la loi normale fournit la probabilitĂ© que Z soit infĂ©rieur ou Ă©gal Ă une valeur donnĂ©e, facilitant ainsi lâĂ©valuation de la position dâune observation dans la distribution.
La transformation en z est un outil clĂ© pour la rĂ©alisation de tests statistiques tels que le test z, permettant de dĂ©terminer si une observation est significativement diffĂ©rente dâune moyenne hypothĂ©tique.
La loi normale est souvent utilisée comme modÚle pour de nombreux phénomÚnes en sciences humaines, notamment en psychologie et sociologie, en raison de ses propriétés mathématiques.
đĄ Ă retenir
La transformation en z standardise une variable pour exploiter la loi normale standard, permettant de calculer facilement des probabilitĂ©s et dâeffectuer des analyses statistiques comparatives. Elle constitue un fondement essentiel pour lâinfĂ©rence statistique en sciences humaines.
đ 10. Table de la loi normale & lecture de z
đ Notions clĂ©s & DĂ©finitions
Loi normale (ou distribution normale) : Distribution de probabilité continue en forme de courbe en cloche, symétrique autour de la moyenne, décrivant de nombreux phénomÚnes naturels et sociaux.
Variable standardisĂ©e (z-score) : Variable alĂ©atoire normalisĂ©e, calculĂ©e par la formule z = (X - ÎŒ) / Ï, permettant de comparer des valeurs issues de distributions diffĂ©rentes.
Table de la loi normale : Tableau permettant de connaĂźtre la probabilitĂ© quâune variable normale standardisĂ©e z soit infĂ©rieure ou Ă©gale Ă une valeur donnĂ©e.
Lecture de z : Processus dâutilisation de la table pour dĂ©terminer la probabilitĂ© associĂ©e Ă une valeur z ou inversement, pour retrouver la valeur z correspondant Ă une probabilitĂ© donnĂ©e.
Point Ă retenir : La table de la loi normale facilite lâinterprĂ©tation des scores z en fournissant rapidement la probabilitĂ© cumulative associĂ©e, essentielle pour lâanalyse statistique infĂ©rentielle.
đ Points essentiels
La loi normale est caractĂ©risĂ©e par sa moyenne ÎŒ et son Ă©cart type Ï ; la distribution est symĂ©trique et en forme de cloche.
La transformation en z-score permet de standardiser nâimporte quelle variable pour utiliser la table de la loi normale.
La table donne la probabilité que Z soit inférieur ou égal à une valeur z (probabilité cumulative).
Pour une valeur z positive, la probabilité correspond à la surface sous la courbe à gauche de z ; pour une valeur négative, on utilise la symétrie de la courbe.
La lecture inverse permet de retrouver la valeur z correspondant à une probabilité donnée (par exemple, pour déterminer un seuil de rejet dans un test statistique).
La rĂšgle empirique (68-95-99,7) sâappuie sur la loi normale : 68% des valeurs sont à ±1Ï, 95% à ±2Ï, et 99,7% à ±3Ï de la moyenne.
đĄ Ă retenir
La table de la loi normale est un outil fondamental pour convertir des scores en probabilitĂ©s et effectuer des analyses statistiques infĂ©rentielles, en permettant de situer une valeur dans la distribution et dâĂ©valuer la significativitĂ© des rĂ©sultats.
đ 11. Distribution de Student & degrĂ©s de libertĂ©
đ Notions clĂ©s & DĂ©finitions
Distribution de Student : Loi de probabilitĂ© utilisĂ©e pour estimer la moyenne dâune population lorsque lâĂ©chantillon est petit et que la variance de la population est inconnue. Elle permet de rĂ©aliser des tests dâhypothĂšses sur la moyenne.
DegrĂ©s de libertĂ© (dl) : Nombre de valeurs indĂ©pendantes dans un calcul statistique, gĂ©nĂ©ralement Ă©gal Ă la taille de lâĂ©chantillon moins le nombre de paramĂštres estimĂ©s (ex. n - 1 pour la moyenne). Ils dĂ©terminent la forme de la distribution de Student.
Test t de Student : Test statistique permettant de comparer la moyenne dâun Ă©chantillon Ă une valeur hypothĂ©tique ou de comparer deux moyennes dâĂ©chantillons indĂ©pendants ou appariĂ©s.
HypothĂšse nulle (H0) : Affirmation Ă tester, gĂ©nĂ©ralement quâil nây a pas de diffĂ©rence ou dâeffet (ex. moyenne Ă©gale Ă une valeur donnĂ©e).
Valeur critique : Seuil déterminé par la distribution de Student pour décider de rejeter ou non H0, en fonction du niveau de signification (α).
đ Points essentiels
La distribution de Student est utilisĂ©e lorsque la taille de lâĂ©chantillon est petite (gĂ©nĂ©ralement n < 30) et que la variance de la population est inconnue.
Elle dépend du nombre de degrés de liberté, qui influence la forme de la courbe : plus le dl est faible, plus la distribution est étalée.
Le test t compare la statistique t calculée à la valeur critique pour déterminer si la différence observée est statistiquement significative.
La formule du t pour un échantillon :
t = x Ë â ÎŒ 0 s / n t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} t = s / n â x Ë â ÎŒ 0 â â
oĂč x Ë \bar{x} x Ë est la moyenne de lâĂ©chantillon, ÎŒ 0 \mu_0 ÎŒ 0 â la moyenne hypothĂ©tique, s s s lâĂ©cart type de lâĂ©chantillon, et n n n la taille de lâĂ©chantillon.
La valeur de t suit une distribution de Student avec n â 1 n-1 n â 1 degrĂ©s de libertĂ©.
La critique du test t : sensible à la normalité de la distribution, surtout pour petits échantillons.
đĄ Ă retenir
La distribution de Student, caractĂ©risĂ©e par ses degrĂ©s de libertĂ©, est essentielle pour rĂ©aliser des tests de moyenne fiables avec de petits Ă©chantillons, permettant dâĂ©valuer si une diffĂ©rence observĂ©e est statistiquement significative ou due au hasard.
đ 12. Lecture inverse & fractiles & quantiles
đ Notions clĂ©s & DĂ©finitions
Fractiles : valeurs qui divisent un ensemble de données en parties égales, permettant de repérer la position relative d'une observation dans une distribution. Exemple : quartiles, déciles, percentiles.
Quantiles : points de coupure d'une distribution qui partagent l'ensemble des donnĂ©es en intervalles de mĂȘme probabilitĂ©. Les fractiles sont un type de quantiles.
Lecture inverse : méthode permettant de retrouver une valeur de donnée à partir de sa position dans une distribution, en utilisant les fractiles ou quantiles.
Les fractiles : valeurs qui segmentent une distribution en parties égales (ex : quartile divise en 4, décile en 10, percentile en 100).
Les points à retenir : Les fractiles et quantiles sont essentiels pour analyser la position relative d'une donnée dans une distribution, facilitant la comparaison entre différentes populations ou échantillons.
đ Points essentiels
Les fractiles permettent de diviser une distribution en segments égaux, facilitant la lecture et l'interprétation des données.
La lecture inverse consiste à déterminer la valeur d'une variable à partir de sa position dans la distribution, en utilisant les fractiles ou quantiles.
Les quartiles (Q1, Q2, Q3) sont des fractiles qui divisent une distribution en quatre parties Ă©gales, oĂč Q2 correspond Ă la mĂ©diane.
Les déciles divisent la distribution en 10 parties égales, et les percentiles en 100.
La relation entre fractiles et quantiles : tous les fractiles sont des quantiles, mais tous les quantiles ne sont pas nécessairement des fractiles (selon la division choisie).
La lecture inverse est utile pour estimer une valeur spécifique dans une distribution à partir de sa position relative (ex : déterminer le score correspondant au 90e percentile).
La mĂ©thode de calcul des quantiles dĂ©pend de la taille de lâĂ©chantillon et de la technique de interpolation utilisĂ©e.
đĄ Ă retenir
Les fractiles et quantiles sont des outils fondamentaux pour analyser la position relative dâune donnĂ©e dans une distribution, permettant une lecture inverse efficace et une comparaison prĂ©cise entre diffĂ©rentes populations ou Ă©chantillons.
đ Tableaux de SynthĂšse
CritĂšre Population Ăchantillon ReprĂ©sentativitĂ© Variables & Niveaux de Mesure DĂ©finition Ensemble complet dâindividus ou objets Sous-ensemble choisi pour Ă©tude CapacitĂ© Ă reflĂ©ter la population CaractĂ©ristiques mesurĂ©es (qualitatives ou quantitatives) Taille Peut ĂȘtre trĂšs grande ou infinie Plus petite, limitĂ©e Essentielle pour gĂ©nĂ©raliser Nominal, ordinal, intervalle, ratio Objectif Analyse globale Estimation ou infĂ©rence Garantir la validitĂ© des rĂ©sultats Choix dĂ©pend du type de variable ReprĂ©sentativitĂ© N/A CritĂšre clĂ© Crucial pour la validitĂ© scientifique DĂ©pend de la mĂ©thode dâĂ©chantillonnage
CritĂšre Variables & CaractĂšres Niveaux de Mesure Statistiques Descriptives & Indicateurs DĂ©finition CaractĂ©ristiques mesurĂ©es sur individus Ăchelles de mesure (nominal, ordinal, intervalle, ratio) Moyenne, mĂ©diane, mode, variance, Ă©cart-type Nature Qualitative ou quantitative DĂ©finissent la nature des opĂ©rations statistiques possibles RĂ©sument ou dĂ©crivent les donnĂ©es Exemple Ăge, sexe, niveau dâĂ©ducation Nominal (sexe), ordinal (niveau), intervalle (tempĂ©rature) Moyenne (Ăąge), mĂ©diane, mode, dispersion Importance Guide le choix de lâanalyse DĂ©termine la mĂ©thode statistique appropriĂ©e Permet une synthĂšse efficace des donnĂ©es
â ïž PiĂšges & Confusions FrĂ©quentes
Confondre population et échantillon, surtout en termes de représentativité.
NĂ©gliger lâimportance du mode de sĂ©lection pour assurer la reprĂ©sentativitĂ©.
Confondre variable nominale et ordinale, notamment dans lâanalyse.
Utiliser la moyenne pour des variables ordinales ou nominales.
Interpréter à tort la dispersion comme une absence de variabilité.
Confondre distribution normale et loi de Gauss, ou croire quâelle sâapplique Ă toutes les donnĂ©es.
Mal interprĂ©ter la transformation en z, en pensant quâelle modifie la distribution.
Confondre la table de la loi normale avec la distribution elle-mĂȘme.
Utiliser la distribution de Student sans ajuster les degrés de liberté.
Mal lire les fractiles ou quantiles, en confondant leur position dans la distribution.
â
Checklist Examen
Définir la statistique et expliquer sa relation avec les faits sociaux.
Distinguer population et Ă©chantillon, et prĂ©ciser lâimportance de la reprĂ©sentativitĂ©.
Identifier le niveau de mesure dâune variable (nominal, ordinal, intervalle, ratio).
Expliquer la différence entre statistiques descriptives et inférentielles.
Définir la médiane, mode, moyenne, et leur rÎle dans la synthÚse des données.
Calculer et interprĂ©ter la variance et lâĂ©cart-type.
Décrire la distribution normale et la loi de Gauss.
Expliquer la transformation en z et ses applications.
Lire une table de la loi normale pour déterminer une probabilité ou un fractile.
DĂ©finir la distribution de Student et prĂ©ciser lâimpact des degrĂ©s de libertĂ©.
Calculer et interpréter un quantile ou un fractile dans une distribution.
Comprendre lâusage des fractiles pour la segmentation ou la classification des donnĂ©es.
Create your own revision sheets Import your course and AI generates sheets, quizzes and flashcards in 30 seconds.
Sheet generator