Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Box-Plot | Weitere Statistische Diagramme
Ultimative Visualisierung mit Python

Swipe um das Menü anzuzeigen

book
Box-Plot

Note
Definition

Boxplot ist ein weiteres äußerst gebräuchliches Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile teilen die (aufsteigend sortierten) Datenpunkte in vier gleich große Teile. Es gibt drei davon:

  • Das erste Quartil (Q1) ist die mittlere Zahl zwischen dem kleinsten Wert (Zahl) der Stichprobe und dem Median (25 % der Daten liegen in diesem Bereich);

  • Das zweite Quartil (Q2) ist der Median selbst (50 % der Daten liegen unterhalb des Medians);

  • Das dritte Quartil (Q3) ist die mittlere Zahl zwischen dem Median der Stichprobe und den höchsten Werten der Stichprobe (75 % der Daten liegen unterhalb von Q3).

Elemente des Boxplots

  • Die rechte Seite des roten Rechtecks stellt das dritte Quartil dar und die linke Seite das erste Quartil;

  • Q3 - Q1 wird als Interquartilsabstand (IQR) bezeichnet, der durch das Rechteck dargestellt wird, wobei die gelbe Linie den Median markiert;

  • Die schwarzen Linien außerhalb des Rechtecks werden als "Whisker" bezeichnet. Die linke Linie stellt Q11.5IR\text{Q1} - 1.5 \cdot \text{IR} dar, die rechte Linie Q3+1.5IR\text{Q3} + 1.5 \cdot \text{IR};

  • Die Datenpunkte außerhalb der Whisker werden als Ausreißer bezeichnet.

Im nächsten Schritt wird ein Boxplot mit der matplotlib-Bibliothek erzeugt:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Die Funktion boxplot() aus dem Modul pyplot wird mit dem ersten und einzigen erforderlichen Parameter x verwendet, der die Daten repräsentiert. Diese Daten können ein array-ähnliches Objekt (z. B. eine Series), ein 2D-Array (für jede Spalte wird ein Boxplot gezeichnet) oder eine Sequenz von 1D-Arrays sein (für jedes Array wird ein Boxplot gezeichnet).

Optionale Parameter

Der Parameter tick_labels ist eine Ausnahme. Dieser ist besonders nützlich, um nicht nur einen einzelnen Boxplot zu beschriften, sondern auch die Boxplots zu beschriften, wenn es mehr als ein Array gibt:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In diesem Beispiel wurde das gesamte DataFrame mit zwei Spalten an boxplot() übergeben, wodurch für jede Spalte separate Boxplots mit automatisch zugewiesenen, passenden Beschriftungen erstellt wurden.

Note
Mehr erfahren

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die Sie in der boxplot() Dokumentation nachlesen können, die in der Praxis jedoch selten verwendet werden.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Datenbasis.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2

Fragen Sie AI

expand
ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

book
Box-Plot

Note
Definition

Boxplot ist ein weiteres äußerst gebräuchliches Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile teilen die (aufsteigend sortierten) Datenpunkte in vier gleich große Teile. Es gibt drei davon:

  • Das erste Quartil (Q1) ist die mittlere Zahl zwischen dem kleinsten Wert (Zahl) der Stichprobe und dem Median (25 % der Daten liegen in diesem Bereich);

  • Das zweite Quartil (Q2) ist der Median selbst (50 % der Daten liegen unterhalb des Medians);

  • Das dritte Quartil (Q3) ist die mittlere Zahl zwischen dem Median der Stichprobe und den höchsten Werten der Stichprobe (75 % der Daten liegen unterhalb von Q3).

Elemente des Boxplots

  • Die rechte Seite des roten Rechtecks stellt das dritte Quartil dar und die linke Seite das erste Quartil;

  • Q3 - Q1 wird als Interquartilsabstand (IQR) bezeichnet, der durch das Rechteck dargestellt wird, wobei die gelbe Linie den Median markiert;

  • Die schwarzen Linien außerhalb des Rechtecks werden als "Whisker" bezeichnet. Die linke Linie stellt Q11.5IR\text{Q1} - 1.5 \cdot \text{IR} dar, die rechte Linie Q3+1.5IR\text{Q3} + 1.5 \cdot \text{IR};

  • Die Datenpunkte außerhalb der Whisker werden als Ausreißer bezeichnet.

Im nächsten Schritt wird ein Boxplot mit der matplotlib-Bibliothek erzeugt:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Die Funktion boxplot() aus dem Modul pyplot wird mit dem ersten und einzigen erforderlichen Parameter x verwendet, der die Daten repräsentiert. Diese Daten können ein array-ähnliches Objekt (z. B. eine Series), ein 2D-Array (für jede Spalte wird ein Boxplot gezeichnet) oder eine Sequenz von 1D-Arrays sein (für jedes Array wird ein Boxplot gezeichnet).

Optionale Parameter

Der Parameter tick_labels ist eine Ausnahme. Dieser ist besonders nützlich, um nicht nur einen einzelnen Boxplot zu beschriften, sondern auch die Boxplots zu beschriften, wenn es mehr als ein Array gibt:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In diesem Beispiel wurde das gesamte DataFrame mit zwei Spalten an boxplot() übergeben, wodurch für jede Spalte separate Boxplots mit automatisch zugewiesenen, passenden Beschriftungen erstellt wurden.

Note
Mehr erfahren

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die Sie in der boxplot() Dokumentation nachlesen können, die in der Praxis jedoch selten verwendet werden.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Datenbasis.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
Wir sind enttäuscht, dass etwas schief gelaufen ist. Was ist passiert?
some-alt