Score de propension

Cet article est consacré au score de propension. Après un rappel des notions de covariables, de biais et des différents types d’étude statistique, Cet article détaille la méthode du score de propension, une méthode utilisée dans les études observationnelle comme technique de contrôle de biais pouvant entaché les conclusions causales. Sans trop aborder les aspects techniques, j’introduire des méthodes de création et de validation du score de propension, son utilisation, et quelques technique de contrôle de biais résiduels inhérent au score de propension. Enfin je présente aussi les forces et faiblesses de la méthode du score de propension. Cet article est inspiré de l’article de Moulis et al. (2018).

Bachirou Taddé https://bachirtadde.github.io
09-25-2020
  1. Télécharger l’article issu de ce post
  2. Télécharger les slides issus de ce post

Les différents types de covariables

Une étude statistique peut être vue comme une collection de variables et de méthodes d’analyse de ces variables conformément à l’objectif de l’étude. Le plus souvent il s’agira d’explorer ou de comprendre le lien entre deux variables spécifiques tout en tenant compte de la présence d’autres variables qui peuvent s’influencer mutuellement : il s’agit là de covariables. Les covariables d’une étude statistique peuvent être réparties en 6 catégories comme indiqué dans la figure 1 (Moulis and Lapeyre-Mestre 2018).

align = center, width=
Figure 1. Les différents types de variables dans une étude statistique (Moulis et al. 2018).

Les différents biais

Le but d’une étude statistique est d’obtenu une représentation exacte de la réalité à partir de l’analyse de données collectées. Pour des raisons de ressources limitées, les données de l’analyse sont incomplètes. Souvent un échantillon de la population est utilisé et les conclusions d’analyse sur l’échantillon sont extrapolées à l’échelle de la population ; ce qui principalement peut induire des erreurs d’appréciation dites bais. Un biais est une erreur de raisonnement ou de procédure qui amène à une représentation fausse de la réalité. Les biais courant en statistique sont :

NB : Il est donc important tout au long d’une étude statistique d’éviter ou de contrôler l’ensemble des biais potentiels.

Les différentes types d’étude

Nous pouvons identifier deux types d’études statistiques :

Etude expérimentale

Une étude expérimentale est une étude contrôlée qui permet de répondre à la question : « est-ce que l’exposition a un effet sur la survenue de l’événement en conditions expérimentales ?». Elle présente les avantages suivantes:

Ses faiblesses sont :

Etude observationnelle

Les études observationnelles permettent de répondre à la question : « quel est l’effet de l’exposition sur la survenue de l’événement en conditions réelles ? » Elle présente l’avantage de faire :

Leurs faiblesses sont :

Méthode de contrôle de biais dans une étude observationnelle

On peut identifier deux approches pour contrôler les biais dans une étude observationnelle :

Méthode du Score de propension

Dans la méthode du score de propension, un score de propension est calculé pour chaque individu. Le score de propension de chaque individu est la probabilité d’être exposé conditionnellement à des covariables de l’étude.

Soit :

\[\begin{equation}\label{eq1} sp = P(X=1\rvert S =s) \end{equation}\]

Ainsi, le jeu de données est complété par les scores de propension des individus calculés à partir de la formule . La formule étant une formule probabiliste, elle requiert une estimation. Je détaillerai dans un prochain article les méthodes d’estimation du score de propension. Toutefois le principe est de faire une régression pour estimer le score de propension de chaque individu.

Méthode de création du score de propension

Choix des variables à inclure dans la création du score

Il est important de définir un vrai porcessus de choix des variables devant servir à la création du score. J’ai pu identifier dans la litérature deux approches que sont:

Validation du score de propension

L’objectif du score de propension est de restaurer une équiprobabilité entre les groupes d’exposition afin de contrôler d potentiels biais (surtout le biais de sélection). Il est donc important de vérifier que le SP restaure l’équiprobabilité d’exposition entre groupe exposé et groupe non exposé. Le score de propension est une variable dérivée de l’étude. Et en tant que telle, on peut vérifier que les groupes d’exposition sont comparables au regard de cette variable, tout comme on faire un test de comparaison de moyenne d’une variable pour comparer des groupes de sujets. On peut donc:

Utilisation du score de propension

Le plus important c’est l’utilisation que nous faisons des outils à disposition. À ce titre, il est important de connaitre les méthodes et recommandations d’utilisation du score de propension.

Le score de propension peut être utilisé comme suit :

De toutes ces méthodes, quelle est la meilleure?

Contrôle de biais résiduels

Des biais résiduels peuvent existés à cause de variables non-observables non prise en compte dans la méthode du score de propension. Ces biais peuvent être corrigés par :

Conclusion

Le score de propension est donc une technique utile pour qu’une étude observationnelle se rapproche des conditions « expérimentales » de comparabilité d’une étude randomisée. Cependant, il n’est pas dénué de limites et ne permet pas de remplacer une étude randomisée.

Références

Moulis, G, and M Lapeyre-Mestre. 2018. “Score de Propension: Intérêts, Utilisation et Limites. Un Guide Pratique Pour Le Clinicien.” La Revue de Médecine Interne 39 (10): 805–12.

Pearl, Judea, and others. 2000. “Models, Reasoning and Inference.” Cambridge, UK: CambridgeUniversityPress.

Rosenbaum, Paul R, and Donald B Rubin. 1984. “Reducing Bias in Observational Studies Using Subclassification on the Propensity Score.” Journal of the American Statistical Association 79 (387): 516–24.

Citation

For attribution, please cite this work as

Taddé (2020, Sept. 25). D-SID: Score de propension. Retrieved from https://bachirtadde.github.io/posts/2020-09-25-score-de-propension/

BibTeX citation

@misc{taddé2020score,
  author = {Taddé, Bachirou},
  title = {D-SID: Score de propension},
  url = {https://bachirtadde.github.io/posts/2020-09-25-score-de-propension/},
  year = {2020}
}