Multikollinearität
Englisch: multicollinearity
Definition
Multikollinearität bezeichnet in einer Regressionsanalyse eine starke lineare Abhängigkeit zwischen mehreren Prädiktoren. Dadurch lassen sich die Effekte einzelner Variablen auf die Zielgröße nicht mehr zuverlässig voneinander trennen. Das Problem tritt insbesondere in der linearen Regression auf, prinzipiell aber auch in anderen Regressionsmodellen.
Hintergrund
Bei ausgeprägter Multikollinearität werden Regressionskoeffizienten instabil. Die Standardfehler der Koeffizienten steigen, Konfidenzintervalle werden breiter und einzelne Effekte können trotz tatsächlicher Assoziation statistisch nicht signifikant erscheinen. Für die Interpretation einzelner Koeffizienten ist das problematisch; die globale Vorhersageleistung des Modells muss dadurch jedoch nicht im gleichen Ausmaß eingeschränkt sein.
Diagnostik
Zur Beurteilung wird häufig der Varianzinflationsfaktor verwendet:
Dabei ist Rj2 das Bestimmtheitsmaß aus der Regression eines Prädiktors auf alle übrigen Prädiktoren. Ein hoher VIF spricht für ausgeprägte Multikollinearität. Paarweise Korrelationskoeffizienten können einen ersten Hinweis geben, erfassen mehrdimensionale lineare Abhängigkeiten jedoch nur unvollständig.
Je nach Fragestellung kommen als Strategien die Entfernung redundanter Variablen, die Zusammenfassung korrelierter Variablen oder Verfahren wie die Hauptkomponentenanalyse in Betracht.