Propensity Score Matching
Definition
Das Propensity Score Matching, kurz PSM, ist ein statistisches Verfahren, das vor allem in Beobachtungsstudien eingesetzt wird. Es dient dazu, Verzerrungen durch ungleich verteilte Hintergrundvariablen zwischen den Vergleichsgruppen zu reduzieren.
Hintergrund
Da in nicht-randomisierten Studien die Gruppenzugehörigkeit nicht zufällig erfolgt, unterscheiden sich die Gruppen häufig systematisch hinsichtlich klinischer, demographischer oder verhaltensbezogener Faktoren. Ds PSM schafft eine vergleichbare Ausgangssituation, indem es Probanden mit ähnlicher Wahrscheinlichkeit für die Exposition einander zuordnet und so die Kovariatenbalance erhöht.
Prinzip
Der zentrale statistische Begriff des Verfahrens ist der Propensity Score, also die geschätzte Wahrscheinlichkeit, dass eine Person eine bestimmte Behandlung oder Exposition erhält, basierend auf ihren beobachteten Merkmalen (Kovariaten).
wobei:
- T = Behandlungs- bzw. Expositionszugehörigkeit (1 = exponiert/behandelt, 0 = nicht exponiert/behandelt)
- X = Vektor der beobachteten Kovariaten (z.B. Alter, Geschlecht, Vorerkrankungen)
- e(x) = geschätzte Wahrscheinlichkeit für T=1 bei gegebener Kovariatenkonstellation X=x
Dieser Wert wird typischerweise mittels logistischer Regression, seltener über maschinelle Lernverfahren, geschätzt. Anschließend werden Individuen mit ähnlichen Propensity Scores einander zugeordnet, sodass Unterschiede in den Kovariaten minimiert werden. Die Effektschätzung erfolgt danach innerhalb des gematchten Kollektivs, meist über Regressionsmodelle oder Mittelwertvergleiche.
Ziele
Ziel des PSM ist es, eine Situation zu erzeugen, die einer randomisierten Zuweisung möglichst nahekommt. Da der Propensity Score die relevanten Kovariaten in einem einzigen Wert zusammenfasst, genügt das Matching auf diesen Wert, um die Verteilung der Kovariaten zwischen den Gruppen auszugleichen. Dies reduziert Confounding durch beobachtete Variablen und erhöht die interne Validität der Analyse. Die Auswahl der Kovariaten ist entscheidend, da unbeobachtete Confounder unberücksichtigt bleiben.
Matching-Methoden
In der Praxis werden verschiedene Matching-Strategien eingesetzt. Am häufigsten wird das Nearest-Neighbor-Matching genutzt. Dabei wird für jede exponierte Person die nicht exponierte Person mit dem ähnlichsten Propensity Score ausgewählt. Alternativ können Caliper eingesetzt werden, die Matches nur innerhalb einer definierten Score-Distanz zulassen, um schlechte Zuordnungen zu vermeiden. Kernel-basierte Methoden nutzen gewichtete Kombinationen mehrerer Kontrollpersonen, was besonders in größeren Datensätzen zu stabileren Schätzungen führen kann.
Anwendungsgebiete
PSM wird vor allem in der klinischen Epidemiologie, Versorgungsforschung und Gesundheitsökonomie eingesetzt, wenn randomisierte Studien nicht verfügbar oder nicht realisierbar sind. Insbesondere bei der Analyse großer Register- oder Routinedaten ermöglicht PSM eine Annäherung an kausale Fragestellungen, indem die Vergleichbarkeit der Gruppen methodisch verbessert wird.
Grenzen
Das Verfahren berücksichtigt ausschließlich beobachtete Kovariaten. Unbeobachtete oder schlecht gemessene Confounder können weiterhin Verzerrungen verursachen. Zudem geht durch das Matching häufig Stichprobenumfang verloren, was die statistische Stärke einschränken kann. Die Güte des Ergebnisses hängt entscheidend davon ab, wie gut das Propensity-Score-Modell spezifiziert ist. Daher ist eine sorgfältige Überprüfung der Kovariatenbalance zwingend erforderlich.
Beispiel
Die Wirksamkeit eines Medikaments wird untersucht. In der behandelten Gruppe sind die Patienten jedoch im Durchschnitt jünger. PSM sucht nun für jeden jüngeren behandelten Patienten einen ähnlich jungen unbehandelten Patienten. So wird ein fairerer Vergleich möglich.
Literatur
- Rosenbaum und Rubin, The central role of the propensity score in observational studies for causal effects, Biometrika, 1983