Ficha de revisão: Estimation et taille d’échantillons

📋 Plan du Cours

  1. Estimation de la moyenne
  2. Intervalle de confiance à 95 %
  3. Risque d’erreur alpha
  4. Cas général et loi de Student
  5. Application à un panier moyen
  6. Intervalle de confiance d’une proportion
  7. Taille d’échantillon pour une moyenne
  8. Taille d’échantillon pour une proportion

📖 1. Estimation de la moyenne

🔑 Notions clés & Définitions

  • Moyenne de l’échantillon : La moyenne de l’échantillon est la valeur 5 calcule a partir des donnees reelles pour estimer la moyenne de la population.
  • Moyenne de la population : La moyenne de la population est la moyenne vraie de tous les individus, qu’on ne connait qu’imparfaitement via l’echantillon.
  • Intervalle de confiance : Un intervalle de confiance est une plage de valeurs construite a partir de l’echantilon qui vise la moyenne vraie de la population.

📝 Points essentiels

  • Un seul calcul de moyenne 5 ne suffit pas pour affirmer la moyenne reelle : on doit encadrer l’estimation.
  • Selon l’echantillon, la moyenne obtenue peut varier (exemples de productions autour de 28,5 L, 30 L, 27,3 L), d’oa l’interet d’un intervalle.
  • Un intervalle de confiance est construit pour que la moyenne vraie appartienne a l’intervalle avec un niveau de confiance (exemples 90%, 95%, 99%).

💡 Astuce mémo

Idee : une moyenne abonnebb valeur ponctuelle, mais l’intervalle donne la abzonebb plausible.

📖 2. Intervalle de confiance à 95 %

🔑 Notions clés & Définitions

  • Niveau de confiance : Le niveau de confiance indique la probabilite que la moyenne vraie soit incluse dans l’intervalle construit selon la methode.
  • IC e 95% : L’IC e 95% est l’intervalle de confiance au seuil 95%, souvent note alaidedebornesa l’aide de bornes e{\pm}$ autour de la moyenne estimee.
  • **Cas aa sigmaconnu:Lecasaconnu** : Le cas asigma$ connu correspond aux formules utilisant un quantile de loi normale pour construire l’intervalle.

📝 Points essentiels

  • Si n>30n>30, que la population est normale et que sigmasigma est connu, on utilise une loi normale pour la statistique (xˉμ)/(σ/n)(\bar x-\mu)/ (\sigma/\sqrt{n}).
  • On a Pr(1,96<(xˉμ)n/σ<1,96)=95\Pr\big(-1,96< (\bar x-\mu)\,\sqrt{n}/\sigma<1,96\big)=95%, ce qui donne Pr(xˉ1,96σ/n<μ<xˉ+1,96σ/n)=95\Pr\big(\bar x-1,96\,\sigma/\sqrt{n}<\mu<\bar x+1,96\,\sigma/\sqrt{n}\big)=95%.
  • L’intervalle de confiance a 95% est [xˉ1,96σ/n;xˉ+1,96σ/n]\left[\bar x-1,96\,\sigma/\sqrt{n};\,\bar x+1,96\,\sigma/\sqrt{n}\right].
  • Dans une etude de taille nn, la moyenne de la population a 95% de chances d’etre dans l’intervalle construit par cette methode.

💡 Astuce mémo

Regle : a 95%, le facteur est 1,96 autour de xˉ\bar x.

📖 3. Risque d’erreur alpha

🔑 Notions clés & Définitions

  • Risque d’erreur α\alpha : Le risque d’erreur α\alpha est la probabilite que la moyenne vraie soit en dehors des bornes d’un intervalle de confiance.
  • Intervalle de confiance X%X\% : Un intervalle de confiance X%X\% est une plage [a;b][a;b] telle que l’exclusion de la moyenne vraie ait une probabilite associee a 1X/1001-X/100.
  • Double rejet symetrique : Dans la construction classique, le risque total α\alpha est reparti en deux queues, α/2\alpha/2 de chaque c{\u00f4}te.

📝 Points essentiels

  • Si un IC vaut X%X\% avec ICX%=[a;b]IC_{X\%}=[a;b], alors la probabilite que la moyenne de la population soit >b>b ou <a<a est appelee risque d’erreur α\alpha.
  • Pour un IC 95% =[a;b]=[a;b], on a α=195/100=5%\alpha=1-95/100=5\%.
  • Dans la logique de calcul, on considere ensuite α/2\alpha/2 pour la queue superior et α/2\alpha/2 pour la queue inferior.
  • Passer de α\alpha eleve e elevee ea reussie reduit en general la largeur (idee d’intervalle plus a{"e}troite pour un risque plus faible).

💡 Astuce mémo

Si 95% : dehors avec probabilite α\alpha, donc α=5%\alpha=5\%, et α/2\alpha/2 par cf4te.

📖 4. Cas général et loi de Student

🔑 Notions clés & Définitions

  • Condition n>30n>30 : La condition n>30n>30 permet d’utiliser les resultats de type normal pour construire des intervalles autour d’une moyenne.
  • Loi de Student : La loi de Student intervient quand on remplace la deviation standard de la population par l’eart-type estime sur l’echantilon.
  • Degrés de liberté (ddl) : Les degres de liberte (ddl) determinent la valeur critique de la loi de Student, typiquement liee a n1n-1.

📝 Points essentiels

  • Les relations de calcul e autour de la moyenne ne sont valables que si n>30n>30 ou si la population suit une loi normale.
  • Lorsque les conditions precises ne sont pas celles du cas normal avec sigmasigma connu, on lit un quantile dans la loi de Student et on utilise les degres de liberte.
  • Dans l’exemple de sondage a 29 personnes, on obtient eddl=28e\text{ddl}=28 et la valeur critique est utilise via la table pour IC95IC95%.
  • Pour IC95IC95% on prend α=5%\alpha=5\%, donc α/2=2,5%\alpha/2=2,5\%, et on lit tα/2=2,05t_{\alpha/2}=2,05 dans la table pour les ddl consideres.
  • L’IC 95% s’ecrit alors sous la forme [xˉtα/2s/n;xˉ+tα/2s/n]\left[\bar x- t_{\alpha/2}\,s/\sqrt{n};\,\bar x+ t_{\alpha/2}\,s/\sqrt{n}\right] (avec ss estimant σ\sigma).

💡 Astuce mémo

Student = a la place de σ\sigma connu : on utilise ss et la table avec les ddl.

📖 5. Application à un panier moyen

🔑 Notions clés & Définitions

  • Panier moyen : Le panier moyen est la moyenne des montants observes sur un ensemble de releves (les paniers) et sert d’estimation de la moyenne de la population concernee.
  • Écart type d’échantillon : L’eart-type d’echantilon ss mesure la dispersion des valeurs observees et sert a construire des intervalles pour la moyenne.
  • IC autour d’une moyenne : Un IC autour d’une moyenne encadre la moyenne vraie par une plage calculee a partir de xˉ\bar x, ss et des quantiles (normale ou Student).

📝 Points essentiels

  • Pour l’exercice (achats), la moyenne observee est xˉ=46,42EUR\bar x=46,42EUR et l’eart-type est s=16,45EURs=16,45EUR avec 100 valeurs relevees.
  • On ne peut pas affirmer a coup sur que la moyenne vraie abans le magasinbb vaut exactement 46,42€ : on a une estimation avec incertitude.
  • Un intervalle de type xˉ±s\bar x \pm s du style 46,42EUR±16,45EUR46,42EUR \pm 16,45EUR n’est pas l’IC e 95% : une vraie IC 95% doit utiliser les quantiles et la taille de l’echantilon.
  • Dans l’exercice, la construction demandee consiste a calculer l’IC e 95% avec nn de l’echantilon et le niveau α=5%\alpha=5\%.
  • La signification attendue d’un IC e 95% est du type ab la moyenne vraie est incluse avec probabilite 95% selon la methodebb, pas un abcertainbb constat unique.

💡 Astuce mémo

Panier moyen : xˉ\bar x donne la valeur estimee, l’IC donne l’intervalle plausible.

📖 6. Intervalle de confiance d’une proportion

🔑 Notions clés & Définitions

  • Proportion de la population : La proportion de la population, notee π\pi, represente la fraction vraie d’individus ayant un caracte{`e}re donne dans toute la population.
  • Proportion d’échantillon : La proportion observee dans l’echantilon, notee pp, est la fraction d’individus avec le caracte{`e}re dans l’echantillon.
  • IC proportion (formule z) : Un intervalle de confiance pour une proportion utilise un quantile zz et l’approximation autour de la proportion pp et de p(1p)p(1-p).

📝 Points essentiels

  • Pour un caracte{`e}re binaire, la proportion population est π\pi et la proportion observee est pp pour un echantillon de taille nn.
  • L’IC d’une proportion s’ecrit sous la forme [pzα/2p(1p)n;p+zα/2p(1p)n]\left[p- z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}};\,p+ z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right].
  • On exprime l’amplitude dd par d=2zα/2np(1p)d=\frac{2z_{\alpha/2}}{\sqrt{n}}\sqrt{p(1-p)}, ce qui permet ensuite de dimensionner nn.
  • Dans l’exercice a la qualite d’etiquette, la variable est qualitative et binaire (Correct vs non correct), donc l’intervalle porte sur la proportion de non-conformes.

💡 Astuce mémo

Proportion : tout tourne autour de p(1p)p(1-p) dans la marge.

📖 7. Taille d’échantillon pour une moyenne

🔑 Notions clés & Définitions

  • Précision (amplitude) : La precision correspond a l’amplitude d de l’intervalle de confiance, donc a la largeur toleree pour encadrer la moyenne.
  • Amplitude d’une IC moyenne : L’amplitude de l’IC pour une moyenne vaut d=2uα/2σ/nd=2\,u_{\alpha/2}\,\sigma/\sqrt{n} dans le schema avec sigmasigma connu ou estime.
  • Taille minimale : La taille minimale d’echantilon nn est celle qui garantit la precision demandee, obtenue en reagenceant la formule d’amplitude.

📝 Points essentiels

  • L’amplitude d’une IC de moyenne vaut d=2uα/2σ/nd=2\,u_{\alpha/2}\,\sigma/\sqrt{n} (avec un quantile uα/2u_{\alpha/2} lie au niveau α\alpha).
  • Pour une amplitude dd fixee, la taille minimale s’obtient par n=4(uα/2σ)2d2n=\frac{4\,(u_{\alpha/2}\sigma)^2}{d^2}.
  • L’estimation de σ\sigma doit venir d’un echantillon assez grand, avec un ordre de grandeur indique : sup00erieur e 30.
  • Le calcul est precise comme utilisable pour evaluer des tailles d’echantillons superieurs e 30.
  • Exemples d’amplitude et tailles minimales donne(s) : pour 10km/h10\,km/h, n=100n=100, pour 5km/h5\,km/h, n=391n=391, et pour 3km/h3\,km/h, n=1084n=1084.

💡 Astuce mémo

Pour gagner en precision (d plus petit), nn augmente comme 1/d21/d^2.

📖 8. Taille d’échantillon pour une proportion

🔑 Notions clés & Définitions

  • IC proportion : marge et amplitude : La marge d’une IC de proportion depend de zα/2z_{\alpha/2}, de p(1p)p(1-p) et de nn, et l’amplitude se ramene a une expression en 1/n1/\sqrt{n}.
  • Terme p(1p)p(1-p) : Le terme p(1p)p(1-p) mesure la variabilite potentielle d’une proportion et intervient directement dans la taille d’echantilon.
  • Taille minimale pour une amplitude : La taille minimale de l’echantilon est obtenue en imposant une amplitude dd a l’IC de proportion.

📝 Points essentiels

  • L’amplitude d’une IC de proportion est donnee par d=2zα/2np(1p)d=\frac{2z_{\alpha/2}}{\sqrt{n}}\sqrt{p(1-p)}.
  • Pour une amplitude dd fixee, la taille minimale s’obtient par n=4zα/22p(1p)d2n=\frac{4z_{\alpha/2}^2\,p(1-p)}{d^2}.
  • L’IC utilise zz (modele normal standard) et suppose l’approximation associee a la loi normale pour construire la marge.
  • La decomposition en pp et 1p1-p montre que la taille necessaire augmente quand la proportion est interm00ediaire (ou p(1p)p(1-p) est plus grand).

💡 Astuce mémo

Proportion : nn suit la formule p(1p)d2\propto \frac{p(1-p)}{d^2}.

⚠️ Pièges & confusions fréquents

  1. Confondre α\alpha et le niveau de confiance : pour un IC 95%, α=5%\alpha=5\%, pas 95%.
  2. Croire que xˉ\bar x est la moyenne vraie : une estimation ponctuelle n’est pas une certitude.
  3. Mélanger un calcul de type xˉ±s\bar x \pm s avec un IC 95% : une vraie IC utilise un quantile (1,96 ou t).
  4. Utiliser les formules de normale avec σ\sigma connu alors que l’écart-type de la population n’est pas connu et que nn n’est pas dans les conditions.
  5. Oublier le facteur de demi-queue α/2\alpha/2 quand on lit dans la table (Student ou normale standard).
  6. Confondre variable quantitative et variable qualitative : la proportion s’analyse avec une IC de proportion, pas une IC de moyenne.
  7. Se tromper sur la taille d’échantillon utilisée dans l’IC : nn doit correspondre au nombre de valeurs (par exemple 100 relevés dans l’exercice panier).

✅ Checklist Examen

  1. Donner la logique : une moyenne ponctuelle 5 ne suffit pas, on construit un intervalle pour encadrer la moyenne vraie.
  2. Écrire l’IC 95% quand n>30n>30, population normale et sigmasigma connu : bornes 5 \pm 1,96\,\sigma/\sqrt{n}.
  3. Relier le risque α\alpha a l’IC : α\alpha est la probabilité que la moyenne vraie sorte des bornes.
  4. Calculer α/2\alpha/2 pour un IC 95% et comprendre pourquoi on utilise une seule queue lors de la lecture de table.
  5. Dans le cas Student, utiliser les ddl appropriés (ddl =n1=n-1 dans l’exemple) et appliquer tα/2=2,05t_{\alpha/2}=2,05 pour l’exemple fourni.
  6. Construire un IC 95% à partir de xˉ\bar x, ss, nn et tα/2t_{\alpha/2} dans les exercices autour d’une moyenne (panier, poids des bocaux).
  7. Exprimer l’IC d’une proportion à partir de pp, nn et zα/2z_{\alpha/2} avec la racine de p(1p)/np(1-p)/n.
  8. Dimensionner nn pour une moyenne à partir d’une amplitude dd via n=4(uα/2σ)2d2n=\frac{4(u_{\alpha/2}\sigma)^2}{d^2}.
  9. Dimensionner nn pour une proportion à partir d’une amplitude dd via n=4zα/22p(1p)d2n=\frac{4z_{\alpha/2}^2 p(1-p)}{d^2}.
  10. Expliquer ce qu’on peut ou ne peut pas affirmer avec une IC (moyenne vraie pas égale à 5 avec certitude, mais incluse avec le niveau de confiance).

Teste seu conhecimento

Teste seu conhecimento sobre Estimation et taille d’échantillons com 16 perguntas de múltipla escolha com correções detalhadas.

1. Quel est le rôle principal de la moyenne de l’échantillon dans l’estimation de la moyenne de la population ?

2. Pourquoi construit-on un intervalle de confiance autour d’une moyenne observée ?

Faça o quiz →

Revisar com flashcards

Memorize os conceitos chave de Estimation et taille d’échantillons com 16 flashcards interativos.

Estimation de la moyenne — définition ?

Valeur ponctuelle et intervalle pour la moyenne vraie.

Intervalle de confiance à 95 % — rôle ?

Encadrer la moyenne vraie avec 95 % de confiance.

Risque d’erreur alpha — signification ?

Probabilité que la vraie moyenne soit hors de l’intervalle.

Veja os flashcards →

Similar courses

Crie suas próprias fichas de revisão

Importe seu curso e a IA gera fichas, quizzes e flashcards em 30 segundos.

Gerador de fichas