Z-Score (Statistik)
Synonym: Z-Wert
Englisch: Z-score
Definition
Der Z-Score ist ein statistisches Maß, das angibt, wie viele Standardabweichungen ein gemessener Wert vom Mittelwert einer Referenzpopulation entfernt liegt. Er dient zur Standardisierung von Messwerten und ermöglicht einen vergleichenden Bezug unabhängig von Maßeinheiten oder Verteilungen.
Hintergrund
Z-Scores werden in vielen Bereichen der Medizin und Forschung verwendet, um individuelle Messergebnisse in den Kontext einer Normpopulation zu stellen. Sie spielen eine zentrale Rolle bei der Interpretation von Laborwerten, Testergebnissen oder bildgebenden Verfahren (siehe auch: Z-Score (Osteodensitometrie)).
Die Berechnung erfolgt nach folgender Formel:
- = der individuelle Messwert
- = Mittelwert der Vergleichsgruppe
- = Standardabweichung der Vergleichsgruppe
Durch die Transformation erhält die standardisierte Variable eine Verteilung mit Mittelwert 0 und Streuung 1. Dies ermöglicht den direkten Vergleich von Variablen mit unterschiedlichen Skalen (z.B. Laborwerte, Alter, Blutdruck) sowie die Interpretation einzelner Werte in Bezug auf ihre Abweichung vom Mittelwert in Standardabweichungen. Ein Z-Score von +1 bedeutet, dass der beobachtete Wert eine Standardabweichung über dem Mittelwert liegt, ein Z-Wert von –2 entsprechend zwei Standardabweichungen darunter.
Anwendung
Der Z-Score wird häufig in der multivariaten Statistik, insbesondere bei Verfahren wie der linearen oder logistischen Regression, der Hauptkomponentenanalyse (PCA) oder der Clusteranalyse, angewendet. Er ist vor allem dann erforderlich, wenn die Modellparameter empfindlich auf unterschiedliche Skalierungen reagieren.
Auch beim Machine-Learning gehört die Umwandlung zum Z-Score zu den gängigen Schritten der Datenvorverarbeitung.
Abgrenzung
Von der Z-Standardisierung zu unterscheiden sind Skalierungen auf andere Normbereiche, etwa die Min-Max-Normierung (Skalierung auf [0, 1]) oder die robuste Standardisierung, die Median und Interquartilsabstand anstelle von Mittelwert und Standardabweichung verwendet, um weniger empfindlich für einzelne Ausreißer zu sein.
Quelle
- Bortz und Schuster, Statistik für Human- und Sozialwissenschaftler. Springer-Verlag, 2010