Ficha de revisão: Introduction aux tests statistiques et prise de décision

📋 Plan du Cours

  1. Rôle des tests statistiques
  2. Hypothèses et prise de décision
  3. Test de conformité d’une moyenne
  4. Comparaison de deux moyennes
  5. Comparaison de deux proportions
  6. Comparaison de deux variances
  7. Tests non paramétriques et Khi-deux
  8. Puissance et risque bêta

📖 1. Rôle des tests statistiques

🔑 Notions clés & Définitions

  • GMQ Gain Moyen Quotidien : Le GMQ est une grandeur moyenne utilisée pour comparer des effets entre populations, comme l’alimentation A versus B chez des animaux identiques.
  • Populations μA et μB : Les symboles μA et μB désignent les moyennes théoriques des deux populations comparées, estimées à partir d’échantillons.
  • Deux échantillons appariés conceptuellement : Deux échantillons correspondent ici à deux groupes issus de la même base (mêmes sujets) mais soumis à des conditions différentes.
  • Taux de guérison : Le taux de guérison est une proportion de sujets guéris après une période, utilisée pour juger l’efficacité d’une prise en charge.

📝 Points essentiels

  • Un test statistique sert à décider si des moyennes/proportions de populations diffèrent réellement ou si l’écart observé peut provenir du hasard.
  • Dans les exemples, on compare des populations en reliant des paramètres théoriques (μA, μB) à des statistiques d’échantillon (moyennes, proportions).
  • On construit un cadre de décision à partir d’hypothèses H0 et H1 pour interpréter des observations comme « conformes » ou « contradictoires » à H0.

💡 Astuce mémo

GMQ et taux de guérison : on teste si la différence est « vraie » ou juste « bruit d’échantillonnage ».

📖 2. Hypothèses et prise de décision

🔑 Notions clés & Définitions

  • Hypothèse nulle H0 : H0 formalise la situation où il n’y a pas d’effet détectable (absence de différence selon le critère étudié).
  • Hypothèse alternative H1 : H1 décrit la situation où l’effet existe, ce qui implique que les paramètres comparés diffèrent entre groupes.
  • Région critique : La région critique correspond aux valeurs d’échantillon jugées trop rares si H0 est vraie, menant au rejet de H0.
  • Accepter ou rejeter H0 : La décision statistique consiste à soit conserver H0 quand les données restent compatibles, soit la rejeter quand elles deviennent incompatibles avec H0.

📝 Points essentiels

  • Si H0 est vraie, on s’attend à observer des résultats d’échantillon compatibles avec H0 ; sinon ces résultats deviennent peu probables.
  • On rejette H0 quand les données sont « peu probables » sous H0, ce qui revient à admettre H1 avec un risque d’erreur quantifié.
  • Les critères de décision dépendent de l’écart entre valeurs (par exemple  x_A et  x_B), de la taille des échantillons et de la dispersion des données.
  • Plus la dispersion est forte, plus le test devient imprécis et augmente la probabilité de retenir H1 moins souvent (donc augmente le risque β).

💡 Astuce mémo

H0 = « compatible », rejet = « vraiment trop rare sous H0 ».

📖 3. Test de conformité d’une moyenne

🔑 Notions clés & Définitions

  • Test bilatéral sur une moyenne : Un test bilatéral confronte H0 : \mu=a à H1 : \mu\neq a afin de détecter un écart dans les deux sens.
  • Test unilatéral sur une moyenne : Un test unilatéral confronte H0 : \mu=a à H1 : \mu>a ou \mu<a afin de chercher un écart dans un seul sens.
  • Écart-type connu σ : Quand l’écart-type de la population est connu (σ connu), on utilise une variable de loi normale et des seuils liés à uu (ou zz).
  • Valeur observée et seuil critique : La décision se fait en comparant une valeur observée normalisée à une valeur seuil lue dans les tables (u/ t / z).

📝 Points essentiels

  • Pour σ connu et test bilatéral : on rejette H0 si \frac|\u007f x-a|\,\sqrt{n}}{\sigma} dépasse uα/2u_{\alpha/2} et on conserve sinon H0.
  • Pour σ inconnu : on utilise la loi de Student et un seuil tt avec n1n-1 ddl ; la dispersion de l’échantillon pilote la statistique.
  • Cas du lot de 16 pièces : avec  x=9{,}8, σ=0,6\sigma=0{,}6 et α=5%, la valeur observée vaut 1,33 et le seuil vaut 1,96, donc on conserve H0.
  • Règle d’intervalle de confiance à 95% (dans l’exemple) : si la moyenne  x est dans [9,706;10,294][9{,}706\,;\,10{,}294] alors on ne rejette pas H0 au risque 5%.

💡 Astuce mémo

Conformité = vérifier que la moyenne tombe dans la « zone raisonnable » (IC ou seuil critique) au risque α.

📖 4. Comparaison de deux moyennes

🔑 Notions clés & Définitions

  • Test T ou Z : Le test de comparaison de deux moyennes utilise Z si les écarts-types de population sont connus et T (Student) si l’écart-type est inconnu.
  • Valeur observée 0˘07fxA0˘07fxB/σ0˘07fxA0˘07fxB|\u007f x_A-\u007f x_B|/\sigma_{\u007f x_A-\u007f x_B} : La statistique de test correspond à la différence normalisée entre les moyennes d’échantillons.
  • ddl pour la table de Student : Les degrés de liberté utilisés pour lire le seuil t correspondent à la somme des tailles moins 2 (dans l’exemple : nA+nB2n_A+n_B-2).
  • p-value comme probabilité critique : La p-value est la probabilité critique liée au risque de rejet à partir des données, et elle sert aussi à trancher entre H0 et H1.

📝 Points essentiels

  • Pour décider à partir d’un test t (ou z), on compare la valeur observée à la valeur seuil lue sur la table correspondante au niveau α et aux ddl.
  • Exemple chaînes de remplissage : nA=14n_A=14, 0˘07fxA=74,73\u007f x_A=74{,}73, sA=0,946s_A=0{,}946 et nB=12n_B=12, 0˘07fxB=75,18\u007f x_B=75{,}18, sB=1,55s_B=1{,}55 donnent une valeur observée 0,875.
  • Dans l’exemple avec α=5% : pour ddl=(14+122)ddl=(14+12-2) la valeur seuil vaut 2,06, et comme 0,875 < 2,06 on conserve H0.
  • Deux façons de conclure sont données : comparaison valeur observée vs seuil ou comparaison p-value à α, et la conclusion doit coïncider.

💡 Astuce mémo

Différence normalisée : si elle reste sous le seuil, H0 tient bon.

📖 5. Comparaison de deux proportions

🔑 Notions clés & Définitions

  • Test de conformité d’une proportion : Le test de conformité d’une proportion vérifie si la proportion observée est compatible avec une valeur théorique π=a\pi=a.
  • Test d’égalité de 2 proportions : Le test d’égalité de 2 proportions examine si deux proportions π1\pi_1 et π2\pi_2 peuvent être considérées égales sous H0.
  • Condition de validité n>50 : Les tests basés sur l’approximation normale sont indiqués comme valables pour des effectifs suffisamment grands, ici avec n>50.
  • Proportion poolée p : La proportion poolée pp combine p1p_1 et p2p_2 pour calculer l’écart-type sous H0 quand π1=π2\pi_1=\pi_2.

📝 Points essentiels

  • Pour le test de conformité bilatéral : on rejette H0 si \frac|p-a|}{\sqrt{\frac{a(1-a)}{n}}} dépasse zα/2z_{\alpha/2} lu sur la loi normale centrée réduite.
  • Pour le test de conformité unilatéral droit : on rejette H0 si paa(1a)n\frac{p-a}{\sqrt{\frac{a(1-a)}{n}}} dépasse zα-z_{\alpha}.
  • Pour l’égalité de 2 proportions : on utilise π1π2N(0;p1pn1+1n2)\pi_1-\pi_2 \sim \mathcal N\left(0;\,p\frac{1-p}{n_1}+\frac{1}{n_2}\right) avec pp proportion poolée.
  • La validité indiquée pour ces tests est n>50 et le tirage est non exhaustif sans remise.

💡 Astuce mémo

Proportions : normaliser pap-a avec l’écart-type sous H0, puis comparer au quantile zz.

📖 6. Comparaison de deux variances

🔑 Notions clés & Définitions

  • Test F de Fisher : Le test F compare des variances de deux populations en utilisant la statistique basée sur le ratio des variances d’échantillon.
  • H0 : rapports de variances =1 : L’hypothèse nulle impose que les variances soient égales (ou proportion égale à 1 selon l’écriture du cours).
  • ddl ν1 et ν2 : Les degrés de liberté de la loi de Fisher dépendent de n11n_1-1 pour le numérateur et n21n_2-1 pour le dénominateur.
  • Ordre numérateur variance la plus grande : La table doit être lue en prenant au numérateur la variance associée à l’échantillon qui a le plus grand écart-type.

📝 Points essentiels

  • But : vérifier si deux populations qui ont la même moyenne ont aussi la même dispersion, en comparant σ12\sigma_1^2 et σ22\sigma_2^2.
  • Test bilatéral : H0 : σ12/σ22=1\sigma_1^2/\sigma_2^2=1 et H1 : σ12/σ221\sigma_1^2/\sigma_2^2\neq 1, avec rejet si le ratio dépasse le quantile critique F correspondant.
  • Test unilatéral : H1 : σ12/σ22>1\sigma_1^2/\sigma_2^2>1, avec rejet si s12/s22s_1^2/s_2^2 est trop grand par rapport à F(1α,ν1,ν2)F(1-\alpha,\nu_1,\nu_2).
  • La loi de Fisher dépend de l’ordre ν1,ν2\nu_1,\nu_2 et s’écrit en pratique avec F(1α,ν1,ν2)F(1-\alpha,\nu_1,\nu_2) pour les lectures de seuil.

💡 Astuce mémo

Variances : on teste un ratio, et on place toujours au numérateur la plus grande dispersion.

📖 7. Tests non paramétriques et Khi-deux

🔑 Notions clés & Définitions

  • Tests non paramétriques : Les tests non paramétriques sont utilisés quand on veut moins d’hypothèses sur la distribution ou quand les données sont qualitatives.
  • Test d’ajustement : Un test d’ajustement vérifie si un échantillon peut être considéré comme issu d’une loi donnée.
  • Test d’indépendance : Un test d’indépendance évalue si deux variables qualitatives sont indépendantes ou au contraire liées.
  • Test du Khi-deux χ2\chi^2 : Le Khi-deux teste des hypothèses sur l’indépendance (Q L) ou sur la conformité d’une distribution (ajustement), via une statistique χ2\chi^2 lue à partir des ddl.

📝 Points essentiels

  • Intérêt : les tests non paramétriques ont un champ d’application plus large (petites tailles n<30n<30 et données qualitatives) mais sont souvent moins puissants et moins documentés.
  • Le Khi-deux dépend du nombre de ddl ; on calcule χ2\chi^2 à partir de la différence (oijeij)(o_{ij}-e_{ij}) au carré divisée par eije_{ij}.
  • Pour l’exemple profession du père vs profession du fils : χobserveˊ2=261,7\chi^2_{observé}=261{,}7 et χ16;5%2=26,29\chi^2_{16;5\%}=26{,}29, donc rejet de H0 et dépendance retenue.
  • ddl pour Khi-deux d’indépendance se calcule comme ν=(k11)(k21)\nu=(k_1-1)(k_2-1), et ici on trouve ν=16\nu=16 pour k1=k2=5k_1=k_2=5.

💡 Astuce mémo

Khi-deux : « écarts observés vs attendus » cumulés, puis on compare à la table selon les ddl.

📖 8. Puissance et risque bêta

🔑 Notions clés & Définitions

  • Risque alpha : Le risque alpha est l’erreur de première espèce, c’est-à-dire le rejet de H0 alors qu’elle est vraie.
  • Risque bêta : Le risque bêta est l’erreur de deuxième espèce, c’est-à-dire la conservation de H0 alors qu’elle est fausse.
  • Puissance du test 1-β : La puissance est la probabilité de rejeter H0 quand H1 est vraie, égale à 1β1-\beta dans le cours.
  • Courbe de puissance : La courbe de puissance trace 1β1-\beta en fonction de la vraie valeur du paramètre réel (en abscisse).

📝 Points essentiels

  • Erreur de première espèce : rejeter H0 quand elle est vraie avec un risque alpha, tandis que l’erreur de deuxième espèce correspond à accepter H0 quand elle est fausse avec risque bêta.
  • On relie rejet/acceptation à des zones : diminuer alpha augmente la zone de non rejet et donc tend à augmenter bêta.
  • Dans l’exemple lot de pièces : si la moyenne réelle est 10,2 mm alors β=0,73\beta=0{,}73 et la puissance vaut donc 0,27 pour détecter l’écart par rapport à 10 mm.
  • A retenir : plus la vraie moyenne est proche de la valeur testée sous H0, plus bêta est élevé et plus le test a une faible probabilité de détecter la différence.

💡 Astuce mémo

Puissance forte = bêta faible : loin de H0, le test « voit » plus facilement.

📊 Tableaux de synthèse

Paramétriques vs non paramétriques

AspectTest paramétriqueTest non paramétrique
HypothèsesConditions d’application plus contraignantes, ex. normalité (test T)Moins exigeant sur la distribution, champ plus large
DonnéesSouvent usage avec variables quantitatives respectant la loiS’utilise pour n<30n<30 et/ou données qualitatives

⚠️ Pièges & confusions fréquents

  1. Confondre alpha et bêta : alpha correspond à rejeter H0 quand elle est vraie, bêta correspond à conserver H0 quand H1 est vraie.
  2. Croire qu’un test « accepte » H0 comme preuve absolue : la décision est conditionnelle aux données et au risque choisi.
  3. Utiliser la mauvaise loi selon σ connu ou inconnu : σ connu implique Z/normalité, σ inconnu implique Student.
  4. Mélanger test bilatéral et unilatéral : les seuils (α/2 ou α) changent, donc la décision change.
  5. Inverser l’ordre dans le test F : la table dépend de ν1,ν2\nu_1,\nu_2 et on doit mettre au numérateur la variance/écart-type le plus grand.
  6. Pour Khi-deux, oublier que les ddl déterminent la valeur seuil : même χ2\chi^2 ne conduit pas au même verdict sans ddl correct.
  7. Interpréter la p-value comme autre chose que la probabilité critique : la comparaison à α pilote le rejet ou la conservation de H0.

✅ Checklist Examen

  1. Définir à quoi sert un test statistique et ce qu’on cherche à trancher (différence réelle vs hasard).
  2. Écrire clairement H0 et H1 pour une question de différence (et préciser quand H1 vise un effet nul ou différent).
  3. Choisir bilatéral ou unilatéral et relier ce choix aux quantiles utilisés (α/2\alpha/2 ou α\alpha).
  4. Pour une moyenne avec σ connu, calculer la statistique 0˘07fxanσ\frac{|\u007f x-a|\sqrt n}{\sigma} et décider via la valeur seuil uα/2u_{\alpha/2}.
  5. Pour une moyenne avec σ inconnu, utiliser la loi de Student avec tt et n1n-1 ddl quand demandé par le cours.
  6. Savoir interpréter l’exemple du lot (IC 95% ou comparaison valeur observée vs seuil) en concluant sur H0 au risque 5%.
  7. Pour comparer deux moyennes, calculer la valeur observée de type différence normalisée et conclure en comparant à la valeur seuil (ou via p-value).
  8. Pour comparer deux proportions, vérifier la condition de validité (n>50) et utiliser l’écart-type sous H0 avec la proportion poolée p quand on compare deux proportions.
  9. Pour le test F, former le ratio s12/s22s_1^2/s_2^2 en plaçant au numérateur la variance la plus grande et lire le seuil sur Fisher-Snedecor avec les bons ddl.
  10. Pour Khi-deux, construire le tableau de contingence, calculer eije_{ij} sous indépendance, calculer χobserveˊ2\chi^2_{observé}, puis comparer à la valeur seuil χν;α2\chi^2_{\nu;\alpha}.
  11. Expliquer la relation entre alpha, bêta et puissance 1β1-\beta, et déduire qualitativement l’effet de la proximité de la vraie moyenne à la valeur testée sur β\beta.

Teste seu conhecimento

Teste seu conhecimento sobre Introduction aux tests statistiques et prise de décision com 11 perguntas de múltipla escolha com correções detalhadas.

1. Quel est le rôle principal d’un test statistique lorsqu’on compare des populations ?

2. Quelle est la principale fonction d’un test statistique dans l’analyse de données ?

Faça o quiz →

Revisar com flashcards

Memorize os conceitos chave de Introduction aux tests statistiques et prise de décision com 9 flashcards interativos.

Rôle des tests statistiques

Décider si différences réelles ou hasard

Rôle test statistique

Décider si différences sont réelles ou aléatoires.

Hypothèses — prise de décision

Rejeter H0 si résultats peu probables sous H0

Veja os flashcards →

Similar courses

Crie suas próprias fichas de revisão

Importe seu curso e a IA gera fichas, quizzes e flashcards em 30 segundos.

Gerador de fichas