Qu'est-ce que c'est ?
Le score de propension (ou propensity score en anglais) est un outil statistique utilisé pour mieux comprendre les résultats d'une intervention ou d'un traitement. Imaginez que vous voulez savoir si un nouveau programme de tutorat améliore les notes des élèves. Il y a un problème : les élèves qui s'inscrivent au programme sont peut-être déjà plus motivés. Comment séparer l'effet du programme de l'effet de leur motivation ? C'est là qu'intervient le score de propension.
Visualiser le concept
1. Le problème : Biais de sélection
Ce graphique montre un groupe de contrôle (élèves non inscrits) et un groupe de traitement (élèves inscrits au programme). Notez que le groupe de traitement a déjà de meilleures notes initiales. Si l'on compare simplement les notes finales, on ne saura pas si l'amélioration est due au programme ou à leur niveau de départ plus élevé.
2. La solution : Scores de propension
Ici, nous calculons un "score de ressemblance" (le score de propension) pour chaque élève. Le graphique montre la distribution de ces scores. Le but est d'apparier les élèves du groupe de traitement avec des élèves du groupe de contrôle ayant un score similaire (la zone de chevauchement). Cela crée des groupes comparables pour une analyse plus juste.
Comment ça marche ?
La méthode se déroule en quelques étapes clés :
- Calcul du score : On utilise un modèle statistique (souvent une régression logistique) pour prédire la probabilité qu'un individu reçoive le traitement. Cette probabilité est le score de propension.
- Appariement : On apparente ensuite les individus du groupe traité avec des individus du groupe de contrôle qui ont un score de propension très proche.
- Analyse : Une fois les groupes appariés, on peut comparer les résultats (par exemple, les notes finales) entre les deux groupes, en étant plus confiant que la différence observée est bien due au traitement et non à d'autres facteurs.
Pourquoi est-ce utile ?
- Réduction des biais : Il permet de corriger les biais de sélection inhérents aux études non randomisées.
- Flexibilité : C'est une méthode très flexible qui peut être utilisée dans de nombreux domaines, de la médecine à l'économie, en passant par le marketing.
- Alternative aux essais randomisés : Lorsque les essais randomisés ne sont pas possibles (pour des raisons éthiques, de coût ou de faisabilité), le score de propension est une excellente alternative pour évaluer un effet causal.