Box-Whiskers-Plot
Synonyme: Boxplot, Kastengrafik
Englisch: box plot
Definition
Bei einem Boxplot handelt es sich um eine grafische Darstellung statistischer Werte.
Vorteile
Der Vorteil eines Boxplots besteht darin, dass gewisse Kennwerte einer Verteilung direkt aus der graphischen Darstellung abgelesen werden können.
Aufbau
Ein Boxplot besteht immer aus einem Rechteck, genannt Box, und zwei Linien, die dieses Rechteck verlängern. Diese Linien werden als Whisker bezeichnet und werden durch einen Strich abgeschlossen.
Die Box entspricht dem Bereich, in dem die mittleren 50 % der Daten liegen. Sie wird also durch das obere und das untere Quartil begrenzt und die Länge der Box entspricht dem Interquartilsabstand. Letzterer ist ein Maß für die Streuung der Daten (siehe auch Standardabweichung) und wird durch die Differenz des oberen und unteren Quartils bestimmt. Der Median wird als durchgehender Strich in die Box eingezeichnet. Dieser teilt das gesamte Diagramm in zwei Hälften, in denen jeweils 50 % der oberen und der unteren Werte liegen. Durch seine Lage innerhalb der Box bekommt man also einen Eindruck von der Schiefe der den Daten zugrunde liegenden Verteilung. Ist der Median im linken bzw. unteren Teil der Box, so ist die Verteilung rechtsschief, liegt er im rechten bzw. oberen Teil, so ist die Verteilung linksschief.
Durch die Whisker werden die außerhalb der Box liegenden Werte dargestellt. Im Gegensatz zur Definition der Box ist die genaue Definition der Whisker nicht einheitlich. Die Berechnung des unteren Whisker erfolgt als 10 %-Quantil und die Berechnung des oberen als 90 %-Quantil. Innerhalb der Whiskergrenzen liegen somit 80 % aller beobachteten Werte.
Die Whisker können auch vom Minimum bis zum Maximum der Wertereihe reichen, dann entspricht ihre Länge der Spannweite. Teilweise werden Ausreißer separat dargestellt, wie in dem Bildbeispiel. Ausreißer sind hierbei definiert als Werte, die weiter als das 1,5fache des Interquartilsabstandes (der Boxgröße) von der Kante der Box entfernt sind. Der Whisker reicht dann bis zum letzten Wert, der kein Ausreißer ist. Die Ausreißer können auch ganz weggelassen werden.
um diese Funktion zu nutzen.