Box-Plot
Synonyme: Box-Whisker-Plot, Boxplot, Kastengrafik
Englisch: box plot
Definition
Bei einem Box-Plot handelt es sich um eine grafische Darstellung statistischer Werte.
Aufbau
Ein Box-Plot besteht immer aus einem Rechteck, genannt Box, und zwei Linien, die dieses Rechteck verlängern. Diese Linien werden als Whisker (deutsch: Schnurrhaare) bezeichnet und durch einen Strich abgeschlossen. Die Grafik kann senkrecht oder waagerecht orientiert sein.
Box
Die Box entspricht dem Bereich, in dem die mittleren 50 % der Daten liegen. Sie wird also durch das obere und das untere Quartil begrenzt und die Länge der Box entspricht dem Interquartilsabstand. Letzterer ist ein Maß für die Streuung der Daten (siehe auch Standardabweichung) und wird durch die Differenz des oberen und unteren Quartils bestimmt. Der Median wird als durchgehender Strich in die Box eingezeichnet. Dieser teilt das gesamte Diagramm in zwei Hälften, in denen jeweils 50 % der oberen und der unteren Werte liegen. Durch seine Lage innerhalb der Box bekommt man also einen Eindruck von der Schiefe der den Daten zugrunde liegenden Verteilung. Ist der Median im unteren bzw. bei waagerecht ausgerichteter Grafik linken Teil der Box, so ist die Verteilung rechtsschief, liegt er im oberen bzw. rechten Teil, so ist die Verteilung linksschief.
Die Breite der Boxen kann variabel gewählt werden. Sie ist dann proportional zur Anzahl der Werte in der jeweiligen Gruppe. Im zweiten Bildbeispiel weiter unten war die Anzahl der Werte in der Gruppe "Labor" 137, in der Gruppe "POCT" 310.
Whisker
Durch die Whisker werden die außerhalb der Box liegenden Werte dargestellt. Im Gegensatz zur Definition der Box ist die genaue Definition der Whisker nicht einheitlich. Die Berechnung des unteren Whisker erfolgt meist als 10 %-Quantil und die Berechnung des oberen als 90 %-Quantil. Innerhalb der Whiskergrenzen liegen somit 80 % aller beobachteten Werte.
Die Whisker können auch vom Minimum bis zum Maximum der Wertereihe reichen, dann entspricht ihre Länge der Spannweite. Teilweise werden Ausreißer separat dargestellt, wie in dem Bildbeispiel. Ausreißer sind hierbei definiert als Werte, die weiter als das 1,5fache des Interquartilsabstandes (der Boxgröße) von der Kante der Box entfernt sind. Der Whisker reicht dann bis zum letzten Wert, der kein Ausreißer ist. Die Ausreißer können auch weggelassen werden.
Notches
Eine weitere Option des Box-Plots sind Notches (Kerben). Diese werden an beiden Seiten der Box auf der Position der Medianlinie eingezeichnet. Ihr Ausdehnung entspricht annähernd dem 95%-Konfidenzintervall des Medians.
Wenn sich in einer Vergleichsdarstellung, wie in dem obigen Beispiel, die Notches nicht überlappen, ist dies ein Indikator dafür, dass die Lage der Mediane tatsächlich unterschiedlich ist. Die Berechnung der Notches erfolgt nach der Formel:
mit n = Anzahl der Datenpunkte
Vorteile
Der Vorteil eines Box-Plots besteht darin, dass wichtige Kennwerte einer Verteilung direkt aus der graphischen Darstellung abgelesen werden können.