Zensierung (Statistik)
Definition
Zensierung bezeichnet unvollständige Beobachtungen in Zeit-bis-Ereignis-Daten. Der exakte Zeitpunkt eines Ereignisses ist nicht bekannt. Es lässt sich lediglich bestimmen, dass das Ereignis vor, nach oder innerhalb eines bestimmten Intervalls eingetreten sein muss. Zensierung ist ein zentrales Grundkonzept der Überlebenszeitanalyse.
Abgrenzung
Zensierte Beobachtungen sind in der Stichprobe enthalten, liefern jedoch nur eingeschränkte Information über den Ereigniszeitpunkt. Trunkierte Beobachtungen fehlen dagegen vollständig, da sie bestimmte Einschlusskriterien nicht erfüllen. Zensierung betrifft somit die Datenvollständigkeit, Trunkierung hingegen die Stichprobenzusammensetzung.
Hintergrund
In klinischen Studien tritt häufig die Situation ein, dass das interessierende Ereignis zum Ende der Beobachtung nicht eingetreten ist oder der exakte Zeitpunkt nicht festgestellt werden kann. Zensierte Beobachtungen werden daher nicht ausgeschlossen, sondern mit speziellen statistischen Verfahren berücksichtigt, um Informationsverlust und Verzerrungen zu vermeiden.
Einteilung
Rechtszensierung
Die Rechtszensierung ist die häufigste Form. Das Ereignis ist bis zum Ende der Beobachtungszeit nicht eingetreten.
Beispiel: In einer Studie wird in einem bestimmten Zeitraum das Rezidivrisiko einer Erkrankung beobachtet. Patient X bekommt in dem Beobachtungszeitraum keinen Rückfall.
Man unterscheidet 3 Typen der Rechtszensierung:
- Typ I: bei einem Experiment mit festgelegter Gesamtdauer wird jede Beobachtung zensiert, wenn bis zum festen Endzeitpunkt kein Ereignis eingetreten ist
- Typ II: das Experiment endet, sobald eine bestimmte Anzahl von Ereignissen erreicht ist
- Typ III: Versuchsobjekte haben unterschiedliche individuelle Start- und Endpunkte innerhalb des Studienzeitraums, wobei Beobachtungen zensiert werden, wenn ihr Endpunkt unbekannt ist oder bis zum letzten bekannten Zeitpunkt kein Ereignis eingetreten ist.
Linkszensierung
Von einer Linkszensierung springt man, wenn das Ereignis bereits vor Beginn der Beobachtungsphase stattgefunden hat. Der genaue Zeitpunkt ist jedoch unbekannt.
Intervallzensierung
Bei der Intervallzensierung tritt das Ereignis innerhalb eines definierten Zeitintervalls ein, ohne dass der exakte Zeitpunkt bestimmt werden kann.
Beispiel: Ein Tumorrezidiv wird erst bei einer späteren Kontrolluntersuchung festgestellt.
Bedeutung
Da nahezu alle klinischen Verlaufsstudien zensierte Daten enthalten, sind spezielle Analyseverfahren erforderlich. Der Kaplan-Meier-Schätzer ermöglicht die Schätzung von Überlebensfunktionen unter Einbezug zensierter Fälle. Die Cox-Proportional-Hazards-Regression modelliert den Einfluss von Kovariablen auf das Hazard. Parametrische Modelle (z.B. Exponential- oder Weibullmodell) werden eingesetzt, wenn bestimmte Verteilungsannahmen getroffen werden.
Fehlerquellen
Zu häufigen Fehlern zählen das Ausschließen zensierter Fälle sowie der Einsatz ungeeigneter Standardverfahren, die vollständige Ereigniszeiten voraussetzen. Zudem setzen die gängigen Modelle voraus, dass Zensierung unabhängig vom Risiko des Ereigniseintritts erfolgt. Wird diese Annahme missachtet, entstehen verzerrte Schätzungen.
Literatur
- Collett. Modelling Survival Data in Medical Research. CRC Press. 2015
- Kleinbaum und Klein. Survival analysis: A self-learning text (3rd ed.). Springer. 2012