Klassische Testtheorie
Englisch: classical test theory (CTT)
Definition
Die Klassische Testtheorie, kurz KTT, ist ein grundlegendes psychometrisches Modell zur Beurteilung der Messgüte psychologischer Tests. Sie bildet die theoretische Grundlage vieler Verfahren zur Schätzung von Reliabilität und Validität. Nach dem Modell setzt sich jeder beobachtete Testwert aus einem "wahren Wert" und einem "Messfehler" zusammen.
Grundannahmen
Die zentrale Gleichung der Klassischen Testtheorie lautet:
Dabei steht:
- X für den beobachteten Testwert,
- T für den wahren Wert und
- E für den Messfehler.
Der wahre Wert beschreibt das stabile Merkmal, das der Test erfassen soll (z. B. Intelligenz). Der Messfehler umfasst zufällige Einflüsse wie Stimmung, Tagesform oder äußere Bedingungen.
Die KTT geht von folgenden Annahmen aus:
- Der Erwartungswert des Messfehlers ist null (E(E) = 0).
- Wahre Werte und Messfehler sind unkorreliert (rTE = 0).
- Messfehler verschiedener Tests sind unkorreliert (rE1E2 = 0).
Ziele und Kennwerte
Ziel der Klassischen Testtheorie ist es, die Genauigkeit eines Tests zu bestimmen. Die Reliabilität beschreibt dabei den Anteil der Varianz der wahren Werte an der Gesamtvarianz der beobachteten Werte:
Ein hoher Wert (nahe 1) weist auf eine geringe Fehleranfälligkeit hin.
Wichtige Kennwerte innerhalb der KTT sind:
- Reliabilität (z. B. Cronbachs α, Split-Half-Reliabilität)
- Standardmessfehler ("standard error of measurement", SEM)
- Trennschärfe eines Items (Korrelation des Itemwerts mit dem Gesamttestwert)
- Itemschwierigkeit (Anteil richtiger Antworten oder mittlerer Itemwert)
Anwendungsbereich
Die Klassische Testtheorie wird in der Testkonstruktion, Testanalyse und Qualitätssicherung psychologischer Messinstrumente eingesetzt. Sie findet Anwendung in der Psychologie, Pädagogik, Medizin (z. B. bei der Fragebogenentwicklung) und Personaldiagnostik.
Limitationen
Die KTT ist stichprobenabhängig. Kennwerte wie Reliabilität oder Itemschwierigkeit können sich zwischen unterschiedlichen Populationen unterscheiden. Zudem erlaubt sie keine genauen Aussagen auf Itemebene über individuelle Leistungen. Diese Einschränkungen führten zur Entwicklung moderner Modelle wie der Item-Response-Theorie (IRT), die latente Merkmale modelliert und stichprobenunabhängigere Ergebnisse liefert.
Literatur
- Lienert, G. A., & Raatz, U. (1998). Testaufbau und Testanalyse. 6. Auflage. Beltz Psychologie Verlags Union.