Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Paar-Diagramm | Visualisierung mit Seaborn
Ultimative Visualisierung mit Python
course content

Kursinhalt

Ultimative Visualisierung mit Python

Ultimative Visualisierung mit Python

1. Einführung in Matplotlib
2. Erstellen Häufig Verwendeter Diagramme
3. Anpassung von Plots
4. Mehr Statistische Diagramme
5. Visualisierung mit Seaborn

book
Paar-Diagramm

Paar-Plot wird verwendet, um eine paarweise Beziehung zwischen den numerischen Variablen in einem Datensatz darzustellen. Es ist dem Joint-Plot sehr ähnlich, jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Paar-Plot ein NxN-Raster von Axes-Objekten (mehrere Unterplots), wobei N die Anzahl der numerischen Variablen ist (numerische Spalten in einem DataFrame).

Schauen wir uns ein Beispiel für einen solchen Plot an:

Beschreibung des Paar-Plots

Wie Sie sehen können, wird für jede Spalte die x-Achse unter allen Plots in den Spalten geteilt, eine bestimmte einzelne Variable liegt auf der x-Achse. Dasselbe gilt für die Zeilen, wo die y-Achse unter allen Plots in der Zeile geteilt wird. Diagonale Plots sind standardmäßig Histogramme, da sie die Verteilung einer einzelnen Variablen (univariate marginale Verteilung) zeigen, und die anderen Plots sind Streudiagramme.

Erstellen eines Pair Plots

Das Erstellen eines Pair Plots mit seaborn läuft darauf hinaus, seine pairplot()-Funktion aufzurufen. Sein wichtigster und einziger erforderlicher Parameter ist data, das ein DataFrame-Objekt sein sollte. Hier ist ein Beispiel für Sie:

1234567
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hier ist iris_df das DataFrame, das wir in die pairplot()-Funktion übergeben, und alles funktioniert einwandfrei. Die Parameter height und aspect geben einfach die Höhe und Breite (height * aspect) jeder Facette (Seite) in Zoll an.

Hue

Ein weiterer Parameter, der erwähnenswert ist, ist hue, der die Variable (Spaltenname) in data angibt, um Plot-Aspekte auf verschiedene Farben abzubilden oder sogar separate Plots (auf einer Axes) für jeden seiner Werte zu erstellen.

Hier ist ein Beispiel, um die Dinge klarer zu machen:

12345678910
import seaborn as sns import matplotlib.pyplot as plt import warnings # Ignoring warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Sie können hier sofort den Unterschied erkennen. Zunächst einmal sind die Datenpunkte in jedem Streudiagramm entsprechend der Spezies gefärbt, zu der sie gehören (der entsprechende Wert in der 'species'-Spalte). Diagonale Plots sind jetzt KDE-Plots (ein separater für jede der Spezies) anstelle der Histogramme.

Tatsächlich macht es bei einem Klassifikationsproblem oft Sinn, ein Paar-Plot mit dem hue-Parameter auf die Zielvariable (kategorische Variable, die wir vorhersagen möchten) zu erstellen.

Ändern der Plot-Arten

Sie können auch andere Plots anstelle der Streudiagramme festlegen und andere diagonale Plots einstellen. Die Parameter kind ('scatter' ist der Standardwert) und diag_kind ('auto' ist der Standardwert, daher basiert seine Art auf der Anwesenheit des hue-Parameters) werden zu diesem Zweck verwendet.

Lassen Sie uns nun unser Beispiel ändern:

1234567
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sind mögliche Werte für den kind-Parameter.

diag_kind kann auf einen der folgenden Werte gesetzt werden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alles ist in dieser Hinsicht ähnlich der jointplot()-Funktion.

Mehr zur pairplot()-Funktion in ihrer Dokumentation.

Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Funktion, um ein Paar-Diagramm zu erstellen.
  2. Setzen Sie die Daten für das Diagramm auf penguins_df über das erste Argument.
  3. Setzen Sie 'sex' als die Spalte, die die Diagrammaspekte auf verschiedene Farben abbildet, indem Sie das zweite Argument angeben.
  4. Setzen Sie die nicht-diagonalen Diagramme auf eine Regressionslinie ('reg') über das dritte Argument.
  5. Setzen Sie height auf 2.
  6. Setzen Sie aspect auf 0.8.

Es kann einige Minuten dauern, die Lösung zu überprüfen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 6
toggle bottom row

book
Paar-Diagramm

Paar-Plot wird verwendet, um eine paarweise Beziehung zwischen den numerischen Variablen in einem Datensatz darzustellen. Es ist dem Joint-Plot sehr ähnlich, jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Paar-Plot ein NxN-Raster von Axes-Objekten (mehrere Unterplots), wobei N die Anzahl der numerischen Variablen ist (numerische Spalten in einem DataFrame).

Schauen wir uns ein Beispiel für einen solchen Plot an:

Beschreibung des Paar-Plots

Wie Sie sehen können, wird für jede Spalte die x-Achse unter allen Plots in den Spalten geteilt, eine bestimmte einzelne Variable liegt auf der x-Achse. Dasselbe gilt für die Zeilen, wo die y-Achse unter allen Plots in der Zeile geteilt wird. Diagonale Plots sind standardmäßig Histogramme, da sie die Verteilung einer einzelnen Variablen (univariate marginale Verteilung) zeigen, und die anderen Plots sind Streudiagramme.

Erstellen eines Pair Plots

Das Erstellen eines Pair Plots mit seaborn läuft darauf hinaus, seine pairplot()-Funktion aufzurufen. Sein wichtigster und einziger erforderlicher Parameter ist data, das ein DataFrame-Objekt sein sollte. Hier ist ein Beispiel für Sie:

1234567
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hier ist iris_df das DataFrame, das wir in die pairplot()-Funktion übergeben, und alles funktioniert einwandfrei. Die Parameter height und aspect geben einfach die Höhe und Breite (height * aspect) jeder Facette (Seite) in Zoll an.

Hue

Ein weiterer Parameter, der erwähnenswert ist, ist hue, der die Variable (Spaltenname) in data angibt, um Plot-Aspekte auf verschiedene Farben abzubilden oder sogar separate Plots (auf einer Axes) für jeden seiner Werte zu erstellen.

Hier ist ein Beispiel, um die Dinge klarer zu machen:

12345678910
import seaborn as sns import matplotlib.pyplot as plt import warnings # Ignoring warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Sie können hier sofort den Unterschied erkennen. Zunächst einmal sind die Datenpunkte in jedem Streudiagramm entsprechend der Spezies gefärbt, zu der sie gehören (der entsprechende Wert in der 'species'-Spalte). Diagonale Plots sind jetzt KDE-Plots (ein separater für jede der Spezies) anstelle der Histogramme.

Tatsächlich macht es bei einem Klassifikationsproblem oft Sinn, ein Paar-Plot mit dem hue-Parameter auf die Zielvariable (kategorische Variable, die wir vorhersagen möchten) zu erstellen.

Ändern der Plot-Arten

Sie können auch andere Plots anstelle der Streudiagramme festlegen und andere diagonale Plots einstellen. Die Parameter kind ('scatter' ist der Standardwert) und diag_kind ('auto' ist der Standardwert, daher basiert seine Art auf der Anwesenheit des hue-Parameters) werden zu diesem Zweck verwendet.

Lassen Sie uns nun unser Beispiel ändern:

1234567
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sind mögliche Werte für den kind-Parameter.

diag_kind kann auf einen der folgenden Werte gesetzt werden:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alles ist in dieser Hinsicht ähnlich der jointplot()-Funktion.

Mehr zur pairplot()-Funktion in ihrer Dokumentation.

Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Funktion, um ein Paar-Diagramm zu erstellen.
  2. Setzen Sie die Daten für das Diagramm auf penguins_df über das erste Argument.
  3. Setzen Sie 'sex' als die Spalte, die die Diagrammaspekte auf verschiedene Farben abbildet, indem Sie das zweite Argument angeben.
  4. Setzen Sie die nicht-diagonalen Diagramme auf eine Regressionslinie ('reg') über das dritte Argument.
  5. Setzen Sie height auf 2.
  6. Setzen Sie aspect auf 0.8.

Es kann einige Minuten dauern, die Lösung zu überprüfen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 6
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt