Test-Retest-Reliabilität
Synonyme: Retest-Reliabilität, zeitliche Stabilität
Englisch: test–retest reliability
Definition
Die Test-Retest-Reliabilität bezeichnet die zeitliche Stabilität eines Messverfahrens. Sie beschreibt, in welchem Ausmaß ein Test bei wiederholter Anwendung unter vergleichbaren Bedingungen zu übereinstimmenden Ergebnissen führt.
Hintergrund
Die Reliabilität zählt zu den zentralen Gütekriterien psychologischer und medizinischer Messinstrumente. Sie beschreibt die Zuverlässigkeit, mit der ein Merkmal erfasst wird, und stellt eine grundlegende Voraussetzung für die valide Interpretation von Testergebnissen dar. Neben der Test-Retest-Reliabilität werden weitere Reliabilitätsformen unterschieden, darunter die interne Konsistenz und die Interrater-Reliabilität. Während diese unterschiedliche Aspekte der Messgenauigkeit abbilden, fokussiert die Test-Retest-Reliabilität spezifisch auf die zeitliche Konstanz der Messung.
Methodisches Vorgehen
Zur Bestimmung der Test-Retest-Reliabilität wird das gleiche Messinstrument zu mindestens zwei Zeitpunkten an derselben Stichprobe angewendet. Der Zusammenhang zwischen den Messwerten wird anschließend berechnet. Abhängig vom Skalenniveau der Daten, den Verteilungsannahmen und der spezifischen Fragestellung können unterschiedliche statistische Maße verwendet werden, häufig Korrelationskoeffizienten oder Intraklassenkorrelationskoeffizienten.
Ein wesentlicher Einflussfaktor ist das Zeitintervall zwischen den Messungen. Ein sehr kurzes Intervall kann Erinnerungseffekte begünstigen, während bei längeren Intervallen reale Veränderungen des untersuchten Merkmals die Reliabilität verringern können. Das Messintervall sollte daher auf Basis der angenommenen Stabilität des zu messenden Merkmals in der Population gewählt werden.
Interpretation
Hohe Test-Retest-Reliabilitäten sprechen für eine stabile und zuverlässige Messung über die Zeit. Niedrige Koeffizienten können auf Messfehler, situative Einflüsse oder tatsächliche zeitliche Veränderungen des Merkmals hinweisen. Entsprechend sind bei stabilen Persönlichkeitsmerkmalen in der Regel höhere Test-Retest-Reliabilitäten zu erwarten als bei ephemeren Zustandsmerkmalen wie Stimmung, Schmerz oder Belastung.
Anwendungsbereiche
Die Test-Retest-Reliabilität ist insbesondere bei der Evaluation diagnostischer Verfahren von Bedeutung, die zur Verlaufsbeurteilung, Prognoseabschätzung oder Therapieevaluation eingesetzt werden. Relevante Anwendungsfelder sind die Psychologie, Psychiatrie, Neurologie sowie die klinische und epidemiologische Forschung.
Abgrenzung
Eine hohe Test-Retest-Reliabilität ist eine notwendige, jedoch keine hinreichende Voraussetzung für die Validität eines Messverfahrens. Ein Instrument kann zeitlich sehr stabile Ergebnisse liefern, ohne das intendierte Konstrukt adäquat zu erfassen.
Literatur
- Bortz und Schuster, Statistik für Human- und Sozialwissenschaftler, 7. Auflage, Springer, 2010