Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Paar-Diagramm | Visualisierung Mit Seaborn
Ultimative Visualisierung mit Python

bookPaar-Diagramm

Note
Definition

Pair Plot wird verwendet, um paarweise Beziehungen zwischen numerischen Variablen in einem Datensatz darzustellen. Er ähnelt stark dem Joint Plot, ist jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Pair Plot ein NxN-Raster von Axes-Objekten (mehrere Subplots), wobei N die Anzahl der numerischen Variablen (numerische Spalten in einem DataFrame) ist.

Beispiel für Pair Plot

Beschreibung des Pair Plots

In einem Pair Plot teilt jede Spalte die gleiche x-Achsen-Variable und jede Zeile die gleiche y-Achsen-Variable. Die Diagonale zeigt Histogramme der einzelnen Variablen, während die anderen Plots Streudiagramme darstellen.

Erstellen eines Pair Plots

Das Erstellen eines Pair Plots mit seaborn erfolgt durch Aufruf der Funktion pairplot(). Der wichtigste und einzige erforderliche Parameter ist data, welcher ein DataFrame-Objekt sein muss.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Das DataFrame iris_df wird an die Funktion pairplot() übergeben. Die Parameter height und aspect definieren die Höhe und Breite (berechnet als Höhe multipliziert mit Aspect) jeder Facette in Zoll.

Hue

Ein weiterer erwähnenswerter Parameter ist hue, der die Variable (Spaltenname) in data angibt, um Aspekte der Darstellung auf verschiedene Farben abzubilden oder sogar für jeden Wert eigene Plots (auf einer Axes) zu erstellen.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Der Unterschied ist hier deutlich zu erkennen. Die Datenpunkte in jedem Streudiagramm sind entsprechend der Art eingefärbt, zu der sie gehören, basierend auf den Werten der species-Spalte. Die Diagonalplots sind jetzt KDE-Plots für jede Art anstelle von Histogrammen.

Bei Klassifikationsproblemen ist es oft sinnvoll, ein Pair Plot mit dem hue-Parameter auf die Zielvariable zu erstellen, also die kategoriale Variable, die vorhergesagt werden soll.


Der Unterschied ist klar. Datenpunkte in jedem Streudiagramm sind entsprechend ihrer Art eingefärbt, basierend auf den Werten der species-Spalte. Die Diagonalplots wurden durch KDE-Plots für jede Art anstelle von Histogrammen ersetzt.

Bei Klassifikationsaufgaben ist es oft hilfreich, ein Pair Plot mit dem hue-Parameter auf die Zielvariable — die zu prognostizierende kategoriale Variable — zu erstellen.

Ändern der Plot-Typen

Es ist möglich, den Typ der verwendeten Plots anstelle der standardmäßigen Scatterplots sowie die auf der Diagonale angezeigten Plots zu ändern. Der Parameter kind steuert die Hauptplots und ist standardmäßig auf Scatterplots eingestellt, während der Parameter diag_kind die Diagonalplots steuert und automatisch gewählt wird, abhängig davon, ob der Parameter hue gesetzt ist.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sind mögliche Werte für den Parameter kind.

diag_kind kann auf einen der folgenden Werte gesetzt werden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

In dieser Hinsicht ist alles ähnlich zur Funktion jointplot().

Note
Weiterführende Informationen

Weitere Informationen finden Sie in der pairplot()-Dokumentation.

Aufgabe

Swipe to start coding

  1. Die korrekte Funktion zur Erstellung eines Pair Plots verwenden.
  2. Die Daten für das Diagramm über das erste Argument auf penguins_df setzen.
  3. Die Spalte 'sex' als Kriterium für die farbliche Unterscheidung der Diagrammaspekte über das zweite Argument festlegen.
  4. Für die nicht-diagonalen Plots eine Regressionslinie ('reg') über das dritte Argument einstellen.
  5. height auf 2 setzen.
  6. aspect auf 0.8 setzen.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 6
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

What other parameters can I use with the pairplot() function?

Can you explain the difference between 'kind' and 'diag_kind' in more detail?

How do I interpret the KDE plots on the diagonal?

close

Awesome!

Completion rate improved to 3.85

bookPaar-Diagramm

Swipe um das Menü anzuzeigen

Note
Definition

Pair Plot wird verwendet, um paarweise Beziehungen zwischen numerischen Variablen in einem Datensatz darzustellen. Er ähnelt stark dem Joint Plot, ist jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Pair Plot ein NxN-Raster von Axes-Objekten (mehrere Subplots), wobei N die Anzahl der numerischen Variablen (numerische Spalten in einem DataFrame) ist.

Beispiel für Pair Plot

Beschreibung des Pair Plots

In einem Pair Plot teilt jede Spalte die gleiche x-Achsen-Variable und jede Zeile die gleiche y-Achsen-Variable. Die Diagonale zeigt Histogramme der einzelnen Variablen, während die anderen Plots Streudiagramme darstellen.

Erstellen eines Pair Plots

Das Erstellen eines Pair Plots mit seaborn erfolgt durch Aufruf der Funktion pairplot(). Der wichtigste und einzige erforderliche Parameter ist data, welcher ein DataFrame-Objekt sein muss.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Das DataFrame iris_df wird an die Funktion pairplot() übergeben. Die Parameter height und aspect definieren die Höhe und Breite (berechnet als Höhe multipliziert mit Aspect) jeder Facette in Zoll.

Hue

Ein weiterer erwähnenswerter Parameter ist hue, der die Variable (Spaltenname) in data angibt, um Aspekte der Darstellung auf verschiedene Farben abzubilden oder sogar für jeden Wert eigene Plots (auf einer Axes) zu erstellen.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Der Unterschied ist hier deutlich zu erkennen. Die Datenpunkte in jedem Streudiagramm sind entsprechend der Art eingefärbt, zu der sie gehören, basierend auf den Werten der species-Spalte. Die Diagonalplots sind jetzt KDE-Plots für jede Art anstelle von Histogrammen.

Bei Klassifikationsproblemen ist es oft sinnvoll, ein Pair Plot mit dem hue-Parameter auf die Zielvariable zu erstellen, also die kategoriale Variable, die vorhergesagt werden soll.


Der Unterschied ist klar. Datenpunkte in jedem Streudiagramm sind entsprechend ihrer Art eingefärbt, basierend auf den Werten der species-Spalte. Die Diagonalplots wurden durch KDE-Plots für jede Art anstelle von Histogrammen ersetzt.

Bei Klassifikationsaufgaben ist es oft hilfreich, ein Pair Plot mit dem hue-Parameter auf die Zielvariable — die zu prognostizierende kategoriale Variable — zu erstellen.

Ändern der Plot-Typen

Es ist möglich, den Typ der verwendeten Plots anstelle der standardmäßigen Scatterplots sowie die auf der Diagonale angezeigten Plots zu ändern. Der Parameter kind steuert die Hauptplots und ist standardmäßig auf Scatterplots eingestellt, während der Parameter diag_kind die Diagonalplots steuert und automatisch gewählt wird, abhängig davon, ob der Parameter hue gesetzt ist.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sind mögliche Werte für den Parameter kind.

diag_kind kann auf einen der folgenden Werte gesetzt werden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

In dieser Hinsicht ist alles ähnlich zur Funktion jointplot().

Note
Weiterführende Informationen

Weitere Informationen finden Sie in der pairplot()-Dokumentation.

Aufgabe

Swipe to start coding

  1. Die korrekte Funktion zur Erstellung eines Pair Plots verwenden.
  2. Die Daten für das Diagramm über das erste Argument auf penguins_df setzen.
  3. Die Spalte 'sex' als Kriterium für die farbliche Unterscheidung der Diagrammaspekte über das zweite Argument festlegen.
  4. Für die nicht-diagonalen Plots eine Regressionslinie ('reg') über das dritte Argument einstellen.
  5. height auf 2 setzen.
  6. aspect auf 0.8 setzen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 6
single

single

some-alt