Kovarianz
Definition
Die Kovarianz ist ein statistisches Maß, das die gemeinsame Variabilität zweier metrischer Zufallsvariablen beschreibt. Sie gibt an, ob und in welcher Richtung zwei Merkmale tendenziell zusammenhängen und bildet damit eine Grundlage vieler multivariater Verfahren.
Hintergrund
Kovarianzen sind symmetrisch und werden bei konstanten Variablen zu null. Sie dienen als Baustein für Kovarianzmatrizen, die in der Schätzung multivariater Modelle, der Fehlerstruktur linearer Modelle oder dimensionalitätsreduzierender Verfahren eingesetzt werden. Die Kovarianz bildet zudem die Grundlage für den Korrelationskoeffizienten, der die gemeinsame Streuung auf eine einheitsfreie Skala überführt.
Berechnung
Die Kovarianz zwischen zwei Variablen X und Y beschreibt den Erwartungswert des Produkts ihrer Abweichungen vom jeweiligen Mittelwert. Für Stichprobendaten wird sie näherungsweise berechnet als
wobei:
- = Stichprobengröße
- = einzelne Beobachtungswerte der Variablen X bzw. Y
- = arithmetische Mittelwerte der Variablen X bzw. Y
- = Summe über alle Beobachtungspaare
Eine positive Kovarianz weist darauf hin, dass größere Werte der einen Variablen eher mit größeren Werten der anderen auftreten, während eine negative Kovarianz auf gegenläufige Zusammenhänge hinweist. Werte nahe null sprechen für das Fehlen eines linearen Zusammenhangs. Da die Kovarianz von den Einheiten der Variablen abhängt, lässt sich die absolute Größe nicht direkt interpretieren. Im Unterschied zur Korrelation ist sie nicht standardisiert, erst durch Normierung an den jeweiligen Standardabweichungen entsteht ein Vergleichsmaß.
Anwendungsgebiete
In der deskriptiven Statistik unterstützt die Kovarianz die Beurteilung linearer Zusammenhänge. In der Inferenzstatistik spielt sie eine zentrale Rolle bei Varianz- und Standardfehlerabschätzungen, etwa in der Regressionsanalyse oder bei Maximum-Likelihood-Verfahren. In der Finanzmathematik beschreibt sie die gemeinsame Schwankung von Renditen und dient der Modellierung von Portfoliorisiken.
Quelle
- Bortz und Schuster, Statistik für Human- und Sozialwissenschaftler, 7. Auflage, Springer, 2010