Lernzettel: Indicateurs et méthodes statistiques en santé

📋 Plan du Cours

  1. Indicateurs de quantification
  2. Tests d’hypothèse
  3. Différence de moyenne
  4. Risque relatif
  5. Odds ratio
  6. Corrélation de Pearson
  7. Régression linéaire
  8. Covariance

📖 1. Indicateurs de quantification

🔑 Notions clés & Définitions

  • Indicateurs d’ampleur d’effet : Mesures permettant d’évaluer la magnitude de la différence ou de l’association entre un facteur étudié et un critère de jugement, au-delà de la simple significativité statistique.
  • Différence de moyenne : Indicateur quantitatif utilisé lorsque le facteur ou le critère est une variable quantitative, représentant la différence moyenne entre deux groupes (notée souvent m1 - m2).
  • Différence de moyenne relative : Rapport entre la différence de moyenne et la moyenne de référence, permettant d’évaluer la pertinence clinique de la différence observée (ex : (m1 - m2) / m2).
  • Risque relatif (RR) : Indicateur utilisé pour quantifier l’association entre un facteur qualitatif binaire et un critère binaire, exprimant le rapport du risque dans le groupe exposé par rapport au groupe non exposé (d’après F. SUBTIL & M. NOURREDINE).
  • Odds ratio (OR) : Rapport de cotes, indicateur d’association pour variables qualitatives binaires, comparant la probabilité d’un événement dans deux groupes (d’après F. SUBTIL & M. NOURREDINE).
  • Interprétation des indicateurs : La valeur nulle ou 1 indique absence d’effet ou d’association, >1 ou positive indique un effet ou risque accru, <1 ou négative indique un effet ou risque réduit.

📝 Points essentiels

  • La sélection de l’indicateur dépend de la nature du facteur (qualitatif ou quantitatif) et du critère de jugement.
  • Pour un facteur qualitatif binaire et un critère binaire, on privilégie le risque relatif ou l’odds ratio, tandis que pour un facteur ou un critère quantitatif, la différence de moyenne ou la différence de moyenne relative sont appropriés.
  • La différence de moyenne permet d’évaluer l’écart moyen entre deux groupes, tandis que la différence de moyenne relative contextualise cette différence en pourcentage ou ratio, facilitant la lecture clinique.
  • Les indicateurs d’ampleur d’effet sont essentiels pour distinguer une différence statistiquement significative d’une différence cliniquement pertinente, comme illustré par l’exemple du cancer de l’œsophage.
  • La compréhension et l’interprétation correctes de ces indicateurs permettent d’évaluer la réelle importance d’un traitement ou d’un facteur dans la pratique clinique, en complément des résultats de tests d’hypothèses.

💡 À retenir

Les indicateurs d’ampleur d’effet, tels que la différence de moyenne, le risque relatif ou l’odds ratio, permettent d’évaluer la pertinence clinique d’une différence ou d’une association, en complément de la significativité statistique. Leur choix doit être adapté à la nature des variables étudiées.

📖 2. Tests d’hypothèse

🔑 Notions clés & Définitions

  • Test d’hypothèse : procédure statistique permettant de déterminer si une hypothèse concernant un paramètre de la population est compatible avec les données observées, en utilisant la p-value pour évaluer la probabilité d’obtenir des résultats aussi extrêmes si l’hypothèse nulle est vraie. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

  • p-value : probabilité, sous l’hypothèse nulle, d’obtenir un résultat aussi ou plus extrême que celui observé. Elle sert à mesurer la compatibilité entre les données et l’hypothèse nulle. Une p-value inférieure à 5 % indique une faible compatibilité, conduisant à rejeter l’hypothèse nulle. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

  • Seuil de signification (α = 5%) : valeur de référence fixée à 5 % pour décider du rejet ou non de l’hypothèse nulle. Si la p-value est inférieure à α, on considère que la différence observée est statistiquement significative. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

  • Fluctuations d’échantillonnage : variations naturelles des résultats d’un échantillon à l’autre, dues au hasard, qui expliquent pourquoi différentes répétitions d’une étude peuvent donner des résultats légèrement différents. Ces fluctuations sont plus importantes avec des échantillons de petite taille ou pour des phénomènes très variables. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

  • Inférence statistique : ensemble des méthodes permettant de généraliser les résultats obtenus sur un échantillon à l’ensemble de la population, en tenant compte de la variabilité et des fluctuations d’échantillonnage. Elle repose notamment sur les tests d’hypothèse et les estimations. (Source : cours des Professeurs F. SUBTIL & M. NOURREDINE)

📝 Points essentiels

  • Les tests d’hypothèse sont fondamentaux pour déterminer si une différence observée dans un échantillon est probablement réelle ou si elle résulte du hasard. La p-value indique la probabilité d’observer un résultat aussi extrême que celui obtenu si l’hypothèse nulle est vraie. Lorsqu’elle est inférieure à 5 %, on rejette cette hypothèse, ce qui suggère une différence statistiquement significative.

  • La variabilité des résultats entre différents échantillons, appelée fluctuations d’échantillonnage, est inévitable et dépend de la taille de l’échantillon et de la nature du phénomène étudié. Elle explique pourquoi il est important de faire une inférence pour tirer des conclusions sur la population.

  • La distinction entre significativité statistique et pertinence clinique est essentielle : une différence peut être statistiquement significative (p-value < 5 %) sans être cliniquement importante (ex. différence de survie de 1 % dans un traitement contre le cancer). La quantification de l’effet (ampleur d’effet) permet d’évaluer la réelle importance clinique d’un résultat.

  • L’inférence statistique permet de généraliser les résultats d’un échantillon à la population, en tenant compte de la variabilité et en utilisant des outils comme les intervalles de confiance et les tests d’hypothèse.

💡 À retenir

Les tests d’hypothèse, avec leur seuil de signification de 5 %, permettent de juger si une différence observée est probablement réelle ou due au hasard, mais il est crucial d’évaluer aussi l’ampleur de l’effet pour déterminer sa pertinence clinique.

📖 3. Différence de moyenne

🔑 Notions clés & Définitions

  • Différence de moyenne : La différence entre la moyenne d’un groupe 2 (m2) et celle d’un groupe 1 (m1), notée m2 – m1. Elle permet d’évaluer l’écart moyen entre deux groupes pour une variable quantitative.
  • Notation des moyennes : m1 et m2 représentent respectivement la moyenne du groupe 1 et du groupe 2. La notation doit respecter l’ordre du contexte, notamment dans le calcul de la différence.
  • Interprétation de la différence :
    • Valeur nulle (0) : aucune différence moyenne entre les groupes.
    • Valeur positive : le groupe 2 a une moyenne supérieure à celle du groupe 1.
    • Valeur négative : le groupe 2 a une moyenne inférieure à celle du groupe 1.
  • Importance de l’ordre : Le sens du calcul (m2 – m1 ou m1 – m2) doit être adapté au contexte pour une interprétation cohérente. La majorité du cours utilise la formule mA – mB dans le sens du contexte.
  • Différence de moyenne relative : Mesure de l’écart en pourcentage ou en proportion par rapport à une moyenne de référence, utilisée pour évaluer la pertinence clinique d’une différence.

📝 Points essentiels

  • La différence de moyenne est une mesure simple pour comparer deux groupes en termes d’une variable quantitative.
  • La notation m1 et m2 doit être claire et cohérente avec le contexte, notamment pour respecter l’ordre dans le calcul.
  • La différence de moyenne peut être positive, négative ou nulle, ce qui indique respectivement une augmentation, une diminution ou l’absence de différence entre les groupes.
  • La différence de moyenne relative, comme le suggère PERROUX (date), est particulièrement utile pour juger de la pertinence clinique, en exprimant l’écart en pourcentage ou en proportion.
  • La fluctuation d’échantillonnage influence la précision de l’estimation de la différence, d’où l’intérêt des tests d’hypothèse et des intervalles de confiance pour valider la signification statistique.

💡 À retenir

La différence de moyenne, en respectant l’ordre du calcul, permet d’évaluer l’écart moyen entre deux groupes, et la différence relative offre une perspective clinique pour juger de l’importance réelle de cette différence.

📖 4. Risque relatif

🔑 Notions clés & Définitions

Risque relatif (RR) : AUTEUR (date) : indicateur d’association qui compare la probabilité d’un événement (par exemple, une maladie) entre deux groupes. Il se calcule en divisant le risque dans le groupe exposé par le risque dans le groupe non exposé.

Utilisation du risque relatif pour variables qualitatives binaires : Le RR est particulièrement adapté pour étudier l’association entre deux variables qualitatives binaires, comme la présence ou l’absence d’un symptôme et la survenue d’une maladie, permettant d’évaluer si l’exposition augmente ou diminue le risque.

Interprétation du risque relatif :

  • RR = 1 : absence d’association (risque identique dans les deux groupes)
  • RR > 1 : augmentation du risque dans le groupe exposé (risque accru)
  • RR < 1 : diminution du risque dans le groupe exposé (risque réduit)

Calcul du risque relatif à partir des données d’étude : RR = (risque dans le groupe exposé) / (risque dans le groupe non exposé). Par exemple, dans l’étude sur l’anosmie et COVID-19, RR = 0,55 / 0,10 = 5,5, indiquant que les individus avec anosmie ont 5,5 fois plus de risque d’être infectés.

📝 Points essentiels

  • Le risque relatif est un indicateur d’association qui permet d’évaluer la force de la relation entre un facteur (exposition) et un critère de jugement (maladie ou autre événement).
  • Il est particulièrement pertinent pour les variables qualitatives binaires, comme dans l’étude de l’anosmie et de l’infection COVID-19, où il compare la probabilité d’être infecté entre les individus présentant ou non le symptôme.
  • La valeur du RR donne une idée claire de l’impact de l’exposition : RR = 1 indique aucune association, RR > 1 indique un risque accru, RR < 1 indique un risque réduit.
  • La formule de calcul est : RR = Risque dans le groupe exposé / Risque dans le groupe non exposé.
  • La limite de l’interprétation du RR doit prendre en compte la valeur absolue des risques dans chaque groupe, car une différence relative importante peut correspondre à des risques absolus faibles ou élevés (voir limite de la différence de risque).

💡 À retenir

Le risque relatif est un outil essentiel pour quantifier l’association entre un facteur qualitatif binaire et un critère de jugement, en indiquant si l’exposition augmente, diminue ou n’a pas d’effet sur la probabilité de survenue de l’événement.

📖 5. Odds ratio

🔑 Notions clés & Définitions

  • Odds ratio (OR) : AUTEUR (date) : rapport entre les cotes d’exposition ou de maladie dans deux groupes, calculé par la formule OR = (odds du groupe 2) / (odds du groupe 1). Il mesure l’association entre un facteur qualitatif binaire et un critère de jugement.
  • Utilisation pour variables qualitatives binaires : L’OR est particulièrement adapté pour quantifier l’association entre deux variables qualitatives binaires, comme le symptôme d’anosmie et l’infection COVID-19, en estimant si la présence d’un facteur augmente ou diminue la probabilité de l’événement.
  • Interprétation de l’OR :
    • OR = 1 : le facteur n’influence pas le critère de jugement, odds identiques dans les deux groupes.
    • OR > 1 : le facteur augmente la probabilité de l’événement (facteur aggravant).
    • OR < 1 : le facteur diminue la probabilité de l’événement (facteur protecteur).
  • Différence entre odds ratio et risque relatif : L’OR compare des cotes (odds), alors que le risque relatif compare des probabilités. L’OR est souvent utilisé dans les études cas-témoins, où le risque relatif n’est pas directement calculable (voir PERROUX (date)).

📝 Points essentiels

  • L’OR permet d’évaluer si un facteur qualitatif binaire, comme la présence d’anosmie, est associé à une augmentation ou une diminution du risque d’un critère de jugement, comme l’infection COVID-19.
  • La formule de l’OR est :
    OR=odds dans le groupe exposeˊodds dans le groupe non exposeˊOR = \frac{\text{odds dans le groupe exposé}}{\text{odds dans le groupe non exposé}}
    où les odds sont le rapport entre le nombre d’individus présentant l’événement et ceux ne le présentant pas dans chaque groupe.
  • Dans l’étude sur l’anosmie et COVID-19, l’OR estimé est d’environ 11, indiquant que les individus avec anosmie ont 11 fois plus de chances d’être infectés par COVID-19 qu ceux sans anosmie.
  • La valeur de l’OR s’éloignant de 1 indique une forte association :
    • OR > 1 : facteur aggravant, augmente la probabilité.
    • OR < 1 : facteur protecteur, diminue la probabilité.
  • L’OR est une mesure relative d’ampleur d’effet, comparable au risque relatif, mais plus adaptée aux études cas-témoins (voir PERROUX (date)).

💡 À retenir

L’odds ratio est une mesure d’association qui compare les cotes d’un facteur entre deux groupes, permettant d’évaluer si ce facteur augmente ou diminue la probabilité d’un événement, notamment dans les études cas-témoins.

📖 6. Corrélation de Pearson

🔑 Notions clés & Définitions

  • Corrélation de Pearson : AUTEUR (1896) : mesure standardisée du degré de relation linéaire entre deux caractéristiques quantitatives x et y, permettant d’évaluer leur association.
  • Coefficient de corrélation (ρ) : rapport de la covariance entre x et y sur le produit de leurs écarts-types, compris entre -1 et +1, indiquant la force et la direction de la relation linéaire.
  • Valeurs possibles : le coefficient de corrélation peut prendre toute valeur entre -1 et +1, où -1 indique une corrélation négative parfaite, +1 une corrélation positive parfaite, et 0 aucune relation linéaire.
  • Interprétation : plus le coefficient est proche de +1 ou -1, plus la relation linéaire est forte ; une valeur proche de 0 indique une faible ou aucune relation linéaire.

📝 Points essentiels

  • Le coefficient de corrélation de Pearson est calculé comme le rapport de la covariance entre deux variables x et y sur le produit de leurs écarts-types :
    ρ=Cov(x,y)σx×σy\rho = \frac{\text{Cov}(x, y)}{\sigma_x \times \sigma_y}
  • Il a le même signe que la covariance : positif pour une relation directe, négatif pour une relation inverse.
  • La valeur absolue de ρ indique la force de la relation :
    • ρ ≈ 1 ou -1 : relation linéaire parfaite (tous les points alignés sur une droite).
    • ρ ≈ 0 : dispersion importante des points, peu ou pas de relation linéaire.
  • Exemple : la corrélation entre la pression artérielle systolique (PAS) et diastolique (PAD) a été estimée à 0,62, indiquant une relation linéaire modérée à forte.
  • La corrélation ne permet pas de quantifier l’effet, elle indique seulement l’existence et la force d’une relation linéaire.

💡 À retenir

La corrélation de Pearson mesure la force et la direction d’une relation linéaire entre deux variables quantitatives, avec une valeur comprise entre -1 et +1, où 0 indique l’absence de relation linéaire.

📖 7. Régression linéaire

🔑 Notions clés & Définitions

  • Régression linéaire : Modèle statistique qui établit une relation linéaire entre une variable dépendante (critère de résultat) et une variable indépendante (facteur étudié), s’écrivant sous la forme yi = β0 + β1 × xi + ei (source : contenu source).
  • Coefficient de régression (β1) : La pente de la droite de régression, qui quantifie la variation moyenne de la variable dépendante (yi) lorsque la variable indépendante (xi) augmente d’une unité. Il est égal au rapport de la covariance entre x et y sur la variance de x, ou au produit du coefficient de corrélation et du rapport des écarts-types (source : contenu source : "β1 = cov(x, y) / var(x)" et "β1 = ρ × (σy / σx)").
  • Intercept (β0) : L’ordonnée à l’origine de la droite de régression, représentant la valeur prédite de yi lorsque xi = 0.
  • Estimation des coefficients : La détermination des valeurs de β0 et β1 à partir des données observées, permettant de modéliser la relation linéaire.
  • Utilisation pour prédiction : La régression permet d’estimer la valeur de yi pour un xi donné, en utilisant la droite de régression estimée, et d’interpréter l’effet du facteur étudié sur le critère de résultat (source : contenu source).

📝 Points essentiels

  • La régression linéaire modélise la relation entre une variable dépendante y et une variable indépendante x par une droite : yi = β0 + β1 × xi + ei.
  • Le coefficient de régression β1 indique la variation moyenne de y lorsque x augmente d’une unité. Il est calculé comme le rapport de la covariance entre x et y sur la variance de x, ou comme le produit du coefficient de corrélation ρ par le rapport des écarts-types de y et x.
  • La covariance entre deux caractéristiques quantitatives x et y mesure leur covariation, en étant le produit des écarts à la moyenne, et indique si elles évoluent dans le même sens (covariance positive) ou en sens opposé (covariance négative). La covariance n’est pas standardisée, dépendant des unités de mesure.
  • Le coefficient de corrélation de Pearson (ρ) est une mesure standardisée du degré de relation linéaire, compris entre -1 et 1, avec une valeur proche de 1 ou -1 indiquant une forte relation linéaire, et une valeur proche de 0 une dispersion importante. Il a le même signe que la covariance.
  • La régression linéaire permet d’estimer l’effet du facteur x sur le critère y, en quantifiant la variation moyenne de y pour une augmentation d’une unité de x. Elle ne doit pas être confondue avec la corrélation, qui ne quantifie pas l’effet mais la force de la relation linéaire.

💡 À retenir

La régression linéaire permet de modéliser et de quantifier l’effet d’un facteur sur un critère de résultat, en estimant la pente de la relation linéaire, tandis que la corrélation mesure simplement la force de cette relation sans en préciser l’effet.

📖 8. Covariance

🔑 Notions clés & Définitions

  • Covariance entre deux variables quantitatives : Mesure la covariation entre deux caractéristiques numériques. Elle est définie comme la moyenne du produit des écarts de chaque valeur par rapport à leur moyenne respective dans la population, soit :
    Cov(x,y)=1Ni=1N(xiμx)(yiμy)\text{Cov}(x, y) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_x)(y_i - \mu_y).
    (source : contenu fourni)

  • Relation entre covariance et corrélation : Le coefficient de corrélation de Pearson est le rapport de la covariance entre deux variables x et y sur le produit de leurs écarts-types :
    ρ=Cov(x,y)σx×σy\rho = \frac{\text{Cov}(x, y)}{\sigma_x \times \sigma_y}.
    (source : contenu fourni)

  • Interprétation de la covariance :

    • Positive : lorsque les deux caractéristiques évoluent dans le même sens (ex : augmentation simultanée).
    • Négative : lorsque les deux caractéristiques évoluent en sens opposé (ex : l'une augmente, l'autre diminue).
    • Nulle : absence de relation linéaire ou relation non linéaire. La covariance n’indique pas la force de la relation, seulement sa direction.
      (source : contenu fourni)
  • Calcul de la covariance à partir des données : La covariance empirique se calcule par :
    Cov(x,y)=1Ni=1N(xixˉ)(yiyˉ)\text{Cov}(x, y) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \bar{x})(y_i - \bar{y}), où xˉ\bar{x} et yˉ\bar{y} sont les moyennes échantillonnales.
    (source : contenu fourni)

📝 Points essentiels

  • La covariance quantifie la tendance générale des deux variables à varier ensemble, en indiquant leur relation linéaire.
  • La valeur de la covariance dépend des unités de mesure des variables, ce qui limite son interprétation directe.
  • La covariance est positive si la majorité des points dans le nuage de données se trouvent dans les quadrants A et C (même sens d’évolution), négative si dans B et D (sens opposé), et nulle si les points sont répartis de manière équilibrée ou si la relation est non linéaire.
  • La covariance n’indique pas la force de la relation, seule sa direction. La valeur absolue n’est pas normalisée, contrairement au coefficient de corrélation.
  • Lorsqu’il n’y a pas de relation linéaire, la covariance est nulle, mais une covariance nulle ne signifie pas forcément absence de toute relation (relation non linéaire possible).
  • La covariance entre la pression artérielle systolique (PAS) et diastolique (PAD) est estimée à 133,62 mmHg, indiquant une tendance à évoluer dans le même sens.
  • La covariance est un indicateur brut, dont l’interprétation doit être complétée par la standardisation via le coefficient de corrélation pour une meilleure compréhension.

💡 À retenir

La covariance indique la direction de la relation linéaire entre deux variables quantitatives, mais sa valeur dépend des unités de mesure. La corrélation standardise cette relation, permettant une interprétation comparative.

📊 Tableaux de Synthèse

IndicateurType de variableUtilisationFormule / ExempleAuteur / Référence
Différence de moyenneQuantitativeComparer deux groupesm2 – m1-
Différence de moyenne relativeQuantitativeÉvaluer la pertinence clinique(m2 – m1) / m1 ou m2PERROUX
Risque relatif (RR)Binaire / QualitativeAssociation entre facteur et événementRisque dans groupe exposé / risque non exposéSUBTIL & NOURREDINE
Odds ratio (OR)Binaire / QualitativeAssociation entre facteur et événementCotes dans groupe exposé / non exposéSUBTIL & NOURREDINE
Corrélation de PearsonQuantitativeRelation linéaire entre deux variablesr = Cov(X,Y) / (σX * σY)-
Régression linéaireQuantitativePrédiction d’une variable par une autreY = a + bX-
CovarianceQuantitativeMesure de la relation entre deux variablesCov(X,Y)-
Test d’hypothèseTypeObjectifCritèreAuteur / Référence
Test statistiqueHypothèse nulleVérifier la compatibilité avec donnéesp-value < 5 %SUBTIL & NOURREDINE
p-valueProbabilitéMesurer la compatibilitép < 0,05SUBTIL & NOURREDINE

⚠️ Pièges & Confusions Fréquentes

  1. Confondre différence de moyenne et différence relative : la première donne un écart absolu, la seconde une proportion ou pourcentage.
  2. Interpréter une p-value faible comme preuve de pertinence clinique, alors qu’elle indique seulement une différence statistique.
  3. Utiliser le risque relatif pour des variables continues, ce qui est incorrect ; réservé aux variables binaires.
  4. Confondre odds ratio et risque relatif : l’OR compare des cotes, le RR des risques.
  5. Ignorer la direction de la différence de moyenne (positive ou négative) lors de l’interprétation.
  6. Croire qu’un résultat statistiquement significatif est toujours cliniquement important.
  7. Oublier que la covariance n’indique pas la force de la relation, mais sa direction et son intensité.

✅ Checklist Examen

  • Connaître la définition et l’interprétation de la différence de moyenne, en particulier la formule (m2 – m1) et son sens.
  • Savoir calculer et interpréter la différence de moyenne relative selon PERROUX.
  • Maîtriser la différence entre risque relatif et odds ratio, et leur contexte d’utilisation selon SUBTIL & NOURREDINE.
  • Comprendre la corrélation de Pearson : formule, interprétation et limites.
  • Expliquer le principe de la régression linéaire et ses applications.
  • Définir la covariance et distinguer son rôle de celui de la corrélation.
  • Connaître la procédure d’un test d’hypothèse, notamment la p-value, le seuil de 5 %, et leur signification.
  • Savoir différencier significativité statistique et pertinence clinique.
  • Identifier les fluctuations d’échantillonnage et leur impact sur l’interprétation.
  • Savoir utiliser et interpréter un test statistique pour comparer deux moyennes ou deux proportions.
  • Comprendre l’objectif et la limite de la covariance.
  • Réviser les auteurs clés : PERROUX pour la différence relative, SUBTIL & NOURREDINE pour RR et OR.

Teste dein Wissen

Teste dein Wissen zu Indicateurs et méthodes statistiques en santé mit 8 Multiple-Choice-Fragen mit detaillierten Korrekturen.

1. Que désigne un indicateur de quantification dans le contexte statistique ?

2. Quel est le nom des auteurs mentionnés dans le contenu comme ayant défini ou utilisé le risque relatif ?

Quiz machen →

Mit Karteikarten lernen

Merke dir die Schlüsselkonzepte von Indicateurs et méthodes statistiques en santé mit 16 interaktiven Karteikarten.

Indicateurs d’effet — définition ?

Mesures évaluant la magnitude d’une différence ou association.

Différence de moyenne — formule ?

m2 – m1, différence entre deux moyennes.

Différence relative — but ?

Évaluer la pertinence clinique en pourcentage.

Karteikarten ansehen →

Similar courses

Erstelle deine eigenen Lernzettel

Importiere deinen Kurs und die KI erstellt in 30 Sekunden Lernzettel, Quizze und Karteikarten.

Lernzettel-Generator