Lernzettel: Indicateurs et méthodes statistiques en santé

Plan du Cours

Indicateurs de quantification
Tests d’hypothèse
Différence de moyenne
Risque relatif
Odds ratio
Corrélation de Pearson
Régression linéaire
Covariance

1. Indicateurs de quantification

Notions clés & Définitions

Indicateurs d’ampleur d’effet : Mesures permettant d’évaluer la magnitude de la différence ou de l’association entre un facteur étudié et un critère de jugement, au-delà de la simple significativité statistique.
Différence de moyenne : Indicateur quantitatif utilisé lorsque le facteur ou le critère est une variable quantitative, représentant la différence moyenne entre deux groupes (notée souvent m1 - m2).
Différence de moyenne relative : Rapport entre la différence de moyenne et la moyenne de référence, permettant d’évaluer la pertinence clinique de la différence observée (ex : (m1 - m2) / m2).
Risque relatif (RR) : Indicateur utilisé pour quantifier l’association entre un facteur qualitatif binaire et un critère binaire, exprimant le rapport du risque dans le groupe exposé par rapport au groupe non exposé (d’après F. SUBTIL & M. NOURREDINE).
Odds ratio (OR) : Rapport de cotes, indicateur d’association pour variables qualitatives binaires, comparant la probabilité d’un événement dans deux groupes (d’après F. SUBTIL & M. NOURREDINE).
Interprétation des indicateurs : La valeur nulle ou 1 indique absence d’effet ou d’association, >1 ou positive indique un effet ou risque accru, <1 ou négative indique un effet ou risque réduit.

Points essentiels

La sélection de l’indicateur dépend de la nature du facteur (qualitatif ou quantitatif) et du critère de jugement.
Pour un facteur qualitatif binaire et un critère binaire, on privilégie le risque relatif ou l’odds ratio, tandis que pour un facteur ou un critère quantitatif, la différence de moyenne ou la différence de moyenne relative sont appropriés.
La différence de moyenne permet d’évaluer l’écart moyen entre deux groupes, tandis que la différence de moyenne relative contextualise cette différence en pourcentage ou ratio, facilitant la lecture clinique.
Les indicateurs d’ampleur d’effet sont essentiels pour distinguer une différence statistiquement significative d’une différence cliniquement pertinente, comme illustré par l’exemple du cancer de l’œsophage.
La compréhension et l’interprétation correctes de ces indicateurs permettent d’évaluer la réelle importance d’un traitement ou d’un facteur dans la pratique clinique, en complément des résultats de tests d’hypothèses.

À retenir

Les indicateurs d’ampleur d’effet, tels que la différence de moyenne, le risque relatif ou l’odds ratio, permettent d’évaluer la pertinence clinique d’une différence ou d’une association, en complément de la significativité statistique. Leur choix doit être adapté à la nature des variables étudiées.

2. Tests d’hypothèse

Notions clés & Définitions

Test d’hypothèse : procédure statistique permettant de déterminer si une hypothèse concernant un paramètre de la population est compatible avec les données observées, en utilisant la p-value pour évaluer la probabilité d’obtenir des résultats aussi extrêmes si l’hypothèse nulle est vraie. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)
p-value : probabilité, sous l’hypothèse nulle, d’obtenir un résultat aussi ou plus extrême que celui observé. Elle sert à mesurer la compatibilité entre les données et l’hypothèse nulle. Une p-value inférieure à 5 % indique une faible compatibilité, conduisant à rejeter l’hypothèse nulle. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)
Seuil de signification (α = 5%) : valeur de référence fixée à 5 % pour décider du rejet ou non de l’hypothèse nulle. Si la p-value est inférieure à α, on considère que la différence observée est statistiquement significative. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)
Fluctuations d’échantillonnage : variations naturelles des résultats d’un échantillon à l’autre, dues au hasard, qui expliquent pourquoi différentes répétitions d’une étude peuvent donner des résultats légèrement différents. Ces fluctuations sont plus importantes avec des échantillons de petite taille ou pour des phénomènes très variables. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)
Inférence statistique : ensemble des méthodes permettant de généraliser les résultats obtenus sur un échantillon à l’ensemble de la population, en tenant compte de la variabilité et des fluctuations d’échantillonnage. Elle repose notamment sur les tests d’hypothèse et les estimations. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

Points essentiels

Les tests d’hypothèse sont fondamentaux pour déterminer si une différence observée dans un échantillon est probablement réelle ou si elle résulte du hasard. La p-value indique la probabilité d’observer un résultat aussi extrême que celui obtenu si l’hypothèse nulle est vraie. Lorsqu’elle est inférieure à 5 %, on rejette cette hypothèse, ce qui suggère une différence statistiquement significative.
La variabilité des résultats entre différents échantillons, appelée fluctuations d’échantillonnage, est inévitable et dépend de la taille de l’échantillon et de la nature du phénomène étudié. Elle explique pourquoi il est important de faire une inférence pour tirer des conclusions sur la population.
La distinction entre significativité statistique et pertinence clinique est essentielle : une différence peut être statistiquement significative (p-value < 5 %) sans être cliniquement importante (ex. différence de survie de 1 % dans un traitement contre le cancer). La quantification de l’effet (ampleur d’effet) permet d’évaluer la réelle importance clinique d’un résultat.
L’inférence statistique permet de généraliser les résultats d’un échantillon à la population, en tenant compte de la variabilité et en utilisant des outils comme les intervalles de confiance et les tests d’hypothèse.

À retenir

Les tests d’hypothèse, avec leur seuil de signification de 5 %, permettent de juger si une différence observée est probablement réelle ou due au hasard, mais il est crucial d’évaluer aussi l’ampleur de l’effet pour déterminer sa pertinence clinique.

3. Différence de moyenne

Notions clés & Définitions

Différence de moyenne : La différence entre la moyenne d’un groupe 2 (m2) et celle d’un groupe 1 (m1), notée m2 – m1. Elle permet d’évaluer l’écart moyen entre deux groupes pour une variable quantitative.
Notation des moyennes : m1 et m2 représentent respectivement la moyenne du groupe 1 et du groupe 2. La notation doit respecter l’ordre du contexte, notamment dans le calcul de la différence.
Interprétation de la différence :
- Valeur nulle (0) : aucune différence moyenne entre les groupes.
- Valeur positive : le groupe 2 a une moyenne supérieure à celle du groupe 1.
- Valeur négative : le groupe 2 a une moyenne inférieure à celle du groupe 1.
Importance de l’ordre : Le sens du calcul (m2 – m1 ou m1 – m2) doit être adapté au contexte pour une interprétation cohérente. La majorité du cours utilise la formule mA – mB dans le sens du contexte.
Différence de moyenne relative : Mesure de l’écart en pourcentage ou en proportion par rapport à une moyenne de référence, utilisée pour évaluer la pertinence clinique d’une différence.

Points essentiels

La différence de moyenne est une mesure simple pour comparer deux groupes en termes d’une variable quantitative.
La notation m1 et m2 doit être claire et cohérente avec le contexte, notamment pour respecter l’ordre dans le calcul.
La différence de moyenne peut être positive, négative ou nulle, ce qui indique respectivement une augmentation, une diminution ou l’absence de différence entre les groupes.
La différence de moyenne relative, comme le suggère PERROUX (date), est particulièrement utile pour juger de la pertinence clinique, en exprimant l’écart en pourcentage ou en proportion.
La fluctuation d’échantillonnage influence la précision de l’estimation de la différence, d’où l’intérêt des tests d’hypothèse et des intervalles de confiance pour valider la signification statistique.

À retenir

La différence de moyenne, en respectant l’ordre du calcul, permet d’évaluer l’écart moyen entre deux groupes, et la différence relative offre une perspective clinique pour juger de l’importance réelle de cette différence.

4. Risque relatif

Notions clés & Définitions

Risque relatif (RR) : AUTEUR (date) : indicateur d’association qui compare la probabilité d’un événement (par exemple, une maladie) entre deux groupes. Il se calcule en divisant le risque dans le groupe exposé par le risque dans le groupe non exposé.

Utilisation du risque relatif pour variables qualitatives binaires : Le RR est particulièrement adapté pour étudier l’association entre deux variables qualitatives binaires, comme la présence ou l’absence d’un symptôme et la survenue d’une maladie, permettant d’évaluer si l’exposition augmente ou diminue le risque.

Interprétation du risque relatif :

RR = 1 : absence d’association (risque identique dans les deux groupes)
RR > 1 : augmentation du risque dans le groupe exposé (risque accru)
RR < 1 : diminution du risque dans le groupe exposé (risque réduit)

Calcul du risque relatif à partir des données d’étude : RR = (risque dans le groupe exposé) / (risque dans le groupe non exposé). Par exemple, dans l’étude sur l’anosmie et COVID-19, RR = 0,55 / 0,10 = 5,5, indiquant que les individus avec anosmie ont 5,5 fois plus de risque d’être infectés.

Points essentiels

Le risque relatif est un indicateur d’association qui permet d’évaluer la force de la relation entre un facteur (exposition) et un critère de jugement (maladie ou autre événement).
Il est particulièrement pertinent pour les variables qualitatives binaires, comme dans l’étude de l’anosmie et de l’infection COVID-19, où il compare la probabilité d’être infecté entre les individus présentant ou non le symptôme.
La valeur du RR donne une idée claire de l’impact de l’exposition : RR = 1 indique aucune association, RR > 1 indique un risque accru, RR < 1 indique un risque réduit.
La formule de calcul est : RR = Risque dans le groupe exposé / Risque dans le groupe non exposé.
La limite de l’interprétation du RR doit prendre en compte la valeur absolue des risques dans chaque groupe, car une différence relative importante peut correspondre à des risques absolus faibles ou élevés (voir limite de la différence de risque).

À retenir

Le risque relatif est un outil essentiel pour quantifier l’association entre un facteur qualitatif binaire et un critère de jugement, en indiquant si l’exposition augmente, diminue ou n’a pas d’effet sur la probabilité de survenue de l’événement.

5. Odds ratio

Notions clés & Définitions

Odds ratio (OR) : AUTEUR (date) : rapport entre les cotes d’exposition ou de maladie dans deux groupes, calculé par la formule OR = (odds du groupe 2) / (odds du groupe 1). Il mesure l’association entre un facteur qualitatif binaire et un critère de jugement.
Utilisation pour variables qualitatives binaires : L’OR est particulièrement adapté pour quantifier l’association entre deux variables qualitatives binaires, comme le symptôme d’anosmie et l’infection COVID-19, en estimant si la présence d’un facteur augmente ou diminue la probabilité de l’événement.
Interprétation de l’OR :
- OR = 1 : le facteur n’influence pas le critère de jugement, odds identiques dans les deux groupes.
- OR > 1 : le facteur augmente la probabilité de l’événement (facteur aggravant).
- OR < 1 : le facteur diminue la probabilité de l’événement (facteur protecteur).
Différence entre odds ratio et risque relatif : L’OR compare des cotes (odds), alors que le risque relatif compare des probabilités. L’OR est souvent utilisé dans les études cas-témoins, où le risque relatif n’est pas directement calculable (voir PERROUX (date)).

Points essentiels

L’OR permet d’évaluer si un facteur qualitatif binaire, comme la présence d’anosmie, est associé à une augmentation ou une diminution du risque d’un critère de jugement, comme l’infection COVID-19.
La formule de l’OR est :
$OR = \frac{\text{odds dans le groupe exposé}}{\text{odds dans le groupe non exposé}}$
où les odds sont le rapport entre le nombre d’individus présentant l’événement et ceux ne le présentant pas dans chaque groupe.
Dans l’étude sur l’anosmie et COVID-19, l’OR estimé est d’environ 11, indiquant que les individus avec anosmie ont 11 fois plus de chances d’être infectés par COVID-19 qu ceux sans anosmie.
La valeur de l’OR s’éloignant de 1 indique une forte association :
- OR > 1 : facteur aggravant, augmente la probabilité.
- OR < 1 : facteur protecteur, diminue la probabilité.
L’OR est une mesure relative d’ampleur d’effet, comparable au risque relatif, mais plus adaptée aux études cas-témoins (voir PERROUX (date)).

À retenir

L’odds ratio est une mesure d’association qui compare les cotes d’un facteur entre deux groupes, permettant d’évaluer si ce facteur augmente ou diminue la probabilité d’un événement, notamment dans les études cas-témoins.

6. Corrélation de Pearson

Notions clés & Définitions

Corrélation de Pearson : AUTEUR (1896) : mesure standardisée du degré de relation linéaire entre deux caractéristiques quantitatives x et y, permettant d’évaluer leur association.
Coefficient de corrélation (ρ) : rapport de la covariance entre x et y sur le produit de leurs écarts-types, compris entre -1 et +1, indiquant la force et la direction de la relation linéaire.
Valeurs possibles : le coefficient de corrélation peut prendre toute valeur entre -1 et +1, où -1 indique une corrélation négative parfaite, +1 une corrélation positive parfaite, et 0 aucune relation linéaire.
Interprétation : plus le coefficient est proche de +1 ou -1, plus la relation linéaire est forte ; une valeur proche de 0 indique une faible ou aucune relation linéaire.

Points essentiels

Le coefficient de corrélation de Pearson est calculé comme le rapport de la covariance entre deux variables x et y sur le produit de leurs écarts-types :
$\rho = \frac{\text{Cov}(x, y)}{\sigma_x \times \sigma_y}$
Il a le même signe que la covariance : positif pour une relation directe, négatif pour une relation inverse.
La valeur absolue de ρ indique la force de la relation :
- ρ ≈ 1 ou -1 : relation linéaire parfaite (tous les points alignés sur une droite).
- ρ ≈ 0 : dispersion importante des points, peu ou pas de relation linéaire.
Exemple : la corrélation entre la pression artérielle systolique (PAS) et diastolique (PAD) a été estimée à 0,62, indiquant une relation linéaire modérée à forte.
La corrélation ne permet pas de quantifier l’effet, elle indique seulement l’existence et la force d’une relation linéaire.

À retenir

La corrélation de Pearson mesure la force et la direction d’une relation linéaire entre deux variables quantitatives, avec une valeur comprise entre -1 et +1, où 0 indique l’absence de relation linéaire.

7. Régression linéaire

Notions clés & Définitions

Régression linéaire : Modèle statistique qui établit une relation linéaire entre une variable dépendante (critère de résultat) et une variable indépendante (facteur étudié), s’écrivant sous la forme yi = β0 + β1 × xi + ei (source : contenu source).
Coefficient de régression (β1) : La pente de la droite de régression, qui quantifie la variation moyenne de la variable dépendante (yi) lorsque la variable indépendante (xi) augmente d’une unité. Il est égal au rapport de la covariance entre x et y sur la variance de x, ou au produit du coefficient de corrélation et du rapport des écarts-types (source : contenu source : "β1 = cov(x, y) / var(x)" et "β1 = ρ × (σy / σx)").
Intercept (β0) : L’ordonnée à l’origine de la droite de régression, représentant la valeur prédite de yi lorsque xi = 0.
Estimation des coefficients : La détermination des valeurs de β0 et β1 à partir des données observées, permettant de modéliser la relation linéaire.
Utilisation pour prédiction : La régression permet d’estimer la valeur de yi pour un xi donné, en utilisant la droite de régression estimée, et d’interpréter l’effet du facteur étudié sur le critère de résultat (source : contenu source).

Points essentiels

La régression linéaire modélise la relation entre une variable dépendante y et une variable indépendante x par une droite : yi = β0 + β1 × xi + ei.
Le coefficient de régression β1 indique la variation moyenne de y lorsque x augmente d’une unité. Il est calculé comme le rapport de la covariance entre x et y sur la variance de x, ou comme le produit du coefficient de corrélation ρ par le rapport des écarts-types de y et x.
La covariance entre deux caractéristiques quantitatives x et y mesure leur covariation, en étant le produit des écarts à la moyenne, et indique si elles évoluent dans le même sens (covariance positive) ou en sens opposé (covariance négative). La covariance n’est pas standardisée, dépendant des unités de mesure.
Le coefficient de corrélation de Pearson (ρ) est une mesure standardisée du degré de relation linéaire, compris entre -1 et 1, avec une valeur proche de 1 ou -1 indiquant une forte relation linéaire, et une valeur proche de 0 une dispersion importante. Il a le même signe que la covariance.
La régression linéaire permet d’estimer l’effet du facteur x sur le critère y, en quantifiant la variation moyenne de y pour une augmentation d’une unité de x. Elle ne doit pas être confondue avec la corrélation, qui ne quantifie pas l’effet mais la force de la relation linéaire.

À retenir

La régression linéaire permet de modéliser et de quantifier l’effet d’un facteur sur un critère de résultat, en estimant la pente de la relation linéaire, tandis que la corrélation mesure simplement la force de cette relation sans en préciser l’effet.

8. Covariance

Notions clés & Définitions

Covariance entre deux variables quantitatives : Mesure la covariation entre deux caractéristiques numériques. Elle est définie comme la moyenne du produit des écarts de chaque valeur par rapport à leur moyenne respective dans la population, soit :
$\text{Cov}(x, y) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_x)(y_i - \mu_y)$ .
(source : contenu fourni)
Relation entre covariance et corrélation : Le coefficient de corrélation de Pearson est le rapport de la covariance entre deux variables x et y sur le produit de leurs écarts-types :
$\rho = \frac{\text{Cov}(x, y)}{\sigma_x \times \sigma_y}$ .
(source : contenu fourni)
Interprétation de la covariance :
- Positive : lorsque les deux caractéristiques évoluent dans le même sens (ex : augmentation simultanée).
- Négative : lorsque les deux caractéristiques évoluent en sens opposé (ex : l'une augmente, l'autre diminue).
- Nulle : absence de relation linéaire ou relation non linéaire. La covariance n’indique pas la force de la relation, seulement sa direction.
  (source : contenu fourni)
Calcul de la covariance à partir des données : La covariance empirique se calcule par :
$\text{Cov}(x, y) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \bar{x})(y_i - \bar{y})$ , où $\bar{x}$ et $\bar{y}$ sont les moyennes échantillonnales.
(source : contenu fourni)

Points essentiels

La covariance quantifie la tendance générale des deux variables à varier ensemble, en indiquant leur relation linéaire.
La valeur de la covariance dépend des unités de mesure des variables, ce qui limite son interprétation directe.
La covariance est positive si la majorité des points dans le nuage de données se trouvent dans :
- les quadrants A et C (même sens d’évolution)
- négative si dans B et D (sens opposé)
- et nulle si les points sont répartis de manière équilibrée
- si la relation est non linéaire
La covariance n’indique pas la force de la relation, seule sa direction. La valeur absolue n’est pas normalisée, contrairement au coefficient de corrélation.
Lorsqu’il n’y a pas de relation linéaire, la covariance est nulle, mais une covariance nulle ne signifie pas forcément absence de toute relation (relation non linéaire possible).
La covariance entre la pression artérielle systolique (PAS) et diastolique (PAD) est estimée à 133,62 mmHg, indiquant une tendance à évoluer dans le même sens.
La covariance est un indicateur brut, dont l’interprétation doit être complétée par la standardisation via le coefficient de corrélation pour une meilleure compréhension.

À retenir

La covariance indique la direction de la relation linéaire entre deux variables quantitatives, mais sa valeur dépend des unités de mesure. La corrélation standardise cette relation, permettant une interprétation comparative.

Tableaux de Synthèse

Indicateur	Type de variable	Utilisation	Formule / Exemple	Auteur / Référence
Différence de moyenne	Quantitative	Comparer deux groupes	m2 – m1	-
Différence de moyenne relative	Quantitative	Évaluer la pertinence clinique	(m2 – m1) / m1 ou m2	PERROUX
Risque relatif (RR)	Binaire / Qualitative	Association entre facteur et événement	Risque dans groupe exposé / risque non exposé	SUBTIL & NOURREDINE
Odds ratio (OR)	Binaire / Qualitative	Association entre facteur et événement	Cotes dans groupe exposé / non exposé	SUBTIL & NOURREDINE
Corrélation de Pearson	Quantitative	Relation linéaire entre deux variables	r = Cov(X,Y) / (σX * σY)	-
Régression linéaire	Quantitative	Prédiction d’une variable par une autre	Y = a + bX	-
Covariance	Quantitative	Mesure de la relation entre deux variables	Cov(X,Y)	-

Test d’hypothèse	Type	Objectif	Critère	Auteur / Référence
Test statistique	Hypothèse nulle	Vérifier la compatibilité avec données	p-value < 5 %	SUBTIL & NOURREDINE
p-value	Probabilité	Mesurer la compatibilité	p < 0,05	SUBTIL & NOURREDINE

Pièges & Confusions Fréquentes

Confondre différence de moyenne et différence relative : la première donne un écart absolu, la seconde une proportion ou pourcentage.
Interpréter une p-value faible comme preuve de pertinence clinique, alors qu’elle indique seulement une différence statistique.
Utiliser le risque relatif pour des variables continues, ce qui est incorrect ; réservé aux variables binaires.
Confondre odds ratio et risque relatif : l’OR compare des cotes, le RR des risques.
Ignorer la direction de la différence de moyenne (positive ou négative) lors de l’interprétation.
Croire qu’un résultat statistiquement significatif est toujours cliniquement important.
Oublier que la covariance n’indique pas la force de la relation, mais sa direction et son intensité.

Checklist Examen

Connaître la définition et l’interprétation de la différence de moyenne, en particulier la formule (m2 – m1) et son sens.
Savoir calculer et interpréter la différence de moyenne relative selon PERROUX.
Maîtriser la différence entre risque relatif et odds ratio, et leur contexte d’utilisation selon SUBTIL & NOURREDINE.
Comprendre la corrélation de Pearson : formule, interprétation et limites.
Expliquer le principe de la régression linéaire et ses applications.
Définir la covariance et distinguer son rôle de celui de la corrélation.
Connaître la procédure d’un test d’hypothèse, notamment la p-value, le seuil de 5 %, et leur signification.
Savoir différencier significativité statistique et pertinence clinique.
Identifier les fluctuations d’échantillonnage et leur impact sur l’interprétation.
Savoir utiliser et interpréter un test statistique pour comparer deux moyennes ou deux proportions.
Comprendre l’objectif et la limite de la covariance.
Réviser les auteurs clés : PERROUX pour la différence relative, SUBTIL & NOURREDINE pour RR et OR.

📋 Plan du Cours

📖 1. Indicateurs de quantification

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 2. Tests d’hypothèse

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 3. Différence de moyenne

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 4. Risque relatif

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 5. Odds ratio

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 6. Corrélation de Pearson

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 7. Régression linéaire

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📖 8. Covariance

🔑 Notions clés & Définitions

📝 Points essentiels

💡 À retenir

📊 Tableaux de Synthèse

⚠️ Pièges & Confusions Fréquentes

✅ Checklist Examen

Teste dein Wissen

Mit Karteikarten lernen

Similar courses

Nutrition et hydratation de l’endurance

Médecine de famille et santé communautaire

Anémie chez le chien et le chat

Développement embryonnaire : nidation à S4

Introduction à l’anatomie-physiologie

Physiologie rénale

Erstelle deine eigenen Lernzettel

Plan du Cours

1. Indicateurs de quantification

Notions clés & Définitions

Points essentiels

À retenir

2. Tests d’hypothèse

Notions clés & Définitions

Points essentiels

À retenir

3. Différence de moyenne

Notions clés & Définitions

Points essentiels

À retenir

4. Risque relatif

Notions clés & Définitions

Points essentiels

À retenir

5. Odds ratio

Notions clés & Définitions

Points essentiels

À retenir

6. Corrélation de Pearson

Notions clés & Définitions

Points essentiels

À retenir

7. Régression linéaire

Notions clés & Définitions

Points essentiels

À retenir

8. Covariance

Notions clés & Définitions

Points essentiels

À retenir

Tableaux de Synthèse

Pièges & Confusions Fréquentes

Checklist Examen