Teststärke
Synonyme: Testpower, statistische Power, Testgüte, Macht eines Tests, Trennschärfe eines Tests, Testschärfe
Englisch: statistical power
Definition
Die Teststärke beschreibt in der Statistik die Wahrscheinlichkeit, einen Fehler 2. Art zu vermeiden. Anders ausgedrückt besagt die Teststärke, wie gut ein statistischer Test darin ist, eine falsche Nullhypothese auch als falsch zu erkennen.
Hintergrund
Um Hypothesen statistisch auf ihre Richtigkeit zu prüfen, kann ein Hypothesentest, z.B. in Form eines t-Tests durchgeführt werden. So lässt sich zum Beispiel prüfen, ob der Mittelwert von zwei Gruppen gleich (Nullhypothese) oder verschieden (Alternativhypothese) ist. Führt man einen Hypothesentest durch, gibt es vier mögliche Konstellationen:
Nullhypothese ist wahr (Beispiel: Mittelwerte sind gleich) |
Nullhypothese ist falsch d.h. die Alternativhypothese ist wahr (Beispiel: Mittelwerte sind verschieden) | |
Der Test favorisiert die Nullhypothese | Nullhypothese wird korrekterweise als wahr erkannt | Fehler 2. Art, β-Fehler: Nullhypothese wird fälschlicherweise als wahr erkannt |
Der Test favorisiert die Alternativhypothese | Fehler 1. Art, α-Fehler: Nullhypothese wird fälschlicherweise verworfen | Nullhypothese wird korrekterweise verworfen |
Statistik
Die Wahrscheinlichkeit, einen Fehler 2. Art zu begehen, wird mit β bezeichnet. Die Teststärke (also die Wahrscheinlichkeit, einen Fehler 2. Art zu vermeiden) ist 1 − β.
Die Teststärke wird beeinflusst durch:
- α-Niveau (Fehler 1. Art)
- Stichprobengröße
- Standardabweichung in der Population
- Effektgröße
- statistische Testmethode
- systematische Fehler (Bias)
Als untere Grenze der Teststärke wird bei der Stichprobenplanung oft ein Wert von 80 % (d.h. 1 − β ≥ 0.8) angestrebt.
Literatur
- Lecturio.de – Statistische Power: Stärke eines Tests, abgerufen am 15.02.2024
um diese Funktion zu nutzen.