Kursinhalt
Ultimative Visualisierung mit Python
Ultimative Visualisierung mit Python
Paar-Diagramm
Paar-Plot wird verwendet, um eine paarweise Beziehung zwischen den numerischen Variablen in einem Datensatz darzustellen. Es ist dem Joint-Plot sehr ähnlich, jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Paar-Plot ein NxN
-Raster von Axes
-Objekten (mehrere Unterplots), wobei N
die Anzahl der numerischen Variablen ist (numerische Spalten in einem DataFrame
).
Schauen wir uns ein Beispiel für einen solchen Plot an:
Beschreibung des Paar-Plots
Wie Sie sehen können, wird für jede Spalte die x-Achse unter allen Plots in den Spalten geteilt, eine bestimmte einzelne Variable liegt auf der x-Achse. Dasselbe gilt für die Zeilen, wo die y-Achse unter allen Plots in der Zeile geteilt wird. Diagonale Plots sind standardmäßig Histogramme, da sie die Verteilung einer einzelnen Variablen (univariate marginale Verteilung) zeigen, und die anderen Plots sind Streudiagramme.
Erstellen eines Pair Plots
Das Erstellen eines Pair Plots mit seaborn
läuft darauf hinaus, seine pairplot()
-Funktion aufzurufen. Sein wichtigster und einziger erforderlicher Parameter ist data
, das ein DataFrame
-Objekt sein sollte. Hier ist ein Beispiel für Sie:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Hier ist iris_df
das DataFrame
, das wir in die pairplot()
-Funktion übergeben, und alles funktioniert einwandfrei. Die Parameter height
und aspect
geben einfach die Höhe und Breite (height * aspect
) jeder Facette (Seite) in Zoll an.
Hue
Ein weiterer Parameter, der erwähnenswert ist, ist hue
, der die Variable (Spaltenname) in data
angibt, um Plot-Aspekte auf verschiedene Farben abzubilden oder sogar separate Plots (auf einer Axes
) für jeden seiner Werte zu erstellen.
Hier ist ein Beispiel, um die Dinge klarer zu machen:
import seaborn as sns import matplotlib.pyplot as plt import warnings # Ignoring warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Sie können hier sofort den Unterschied erkennen. Zunächst einmal sind die Datenpunkte in jedem Streudiagramm entsprechend der Spezies gefärbt, zu der sie gehören (der entsprechende Wert in der 'species'
-Spalte). Diagonale Plots sind jetzt KDE-Plots (ein separater für jede der Spezies) anstelle der Histogramme.
Tatsächlich macht es bei einem Klassifikationsproblem oft Sinn, ein Paar-Plot mit dem hue
-Parameter auf die Zielvariable (kategorische Variable, die wir vorhersagen möchten) zu erstellen.
Ändern der Plot-Arten
Sie können auch andere Plots anstelle der Streudiagramme festlegen und andere diagonale Plots einstellen. Die Parameter kind
('scatter'
ist der Standardwert) und diag_kind
('auto'
ist der Standardwert, daher basiert seine Art auf der Anwesenheit des hue
-Parameters) werden zu diesem Zweck verwendet.
Lassen Sie uns nun unser Beispiel ändern:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter'
, 'kde'
, 'hist'
, 'reg'
sind mögliche Werte für den kind
-Parameter.
diag_kind
kann auf einen der folgenden Werte gesetzt werden:
'auto'
;'hist'
;'kde'
;None
.
Alles ist in dieser Hinsicht ähnlich der jointplot()
-Funktion.
Mehr zur pairplot()
-Funktion in ihrer Dokumentation.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein Paar-Diagramm zu erstellen.
- Setzen Sie die Daten für das Diagramm auf
penguins_df
über das erste Argument. - Setzen Sie
'sex'
als die Spalte, die die Diagrammaspekte auf verschiedene Farben abbildet, indem Sie das zweite Argument angeben. - Setzen Sie die nicht-diagonalen Diagramme auf eine Regressionslinie (
'reg'
) über das dritte Argument. - Setzen Sie
height
auf2
. - Setzen Sie
aspect
auf0.8
.
Es kann einige Minuten dauern, die Lösung zu überprüfen.
Lösung
Danke für Ihr Feedback!
Paar-Diagramm
Paar-Plot wird verwendet, um eine paarweise Beziehung zwischen den numerischen Variablen in einem Datensatz darzustellen. Es ist dem Joint-Plot sehr ähnlich, jedoch nicht auf nur zwei Variablen beschränkt. Tatsächlich erstellt ein Paar-Plot ein NxN
-Raster von Axes
-Objekten (mehrere Unterplots), wobei N
die Anzahl der numerischen Variablen ist (numerische Spalten in einem DataFrame
).
Schauen wir uns ein Beispiel für einen solchen Plot an:
Beschreibung des Paar-Plots
Wie Sie sehen können, wird für jede Spalte die x-Achse unter allen Plots in den Spalten geteilt, eine bestimmte einzelne Variable liegt auf der x-Achse. Dasselbe gilt für die Zeilen, wo die y-Achse unter allen Plots in der Zeile geteilt wird. Diagonale Plots sind standardmäßig Histogramme, da sie die Verteilung einer einzelnen Variablen (univariate marginale Verteilung) zeigen, und die anderen Plots sind Streudiagramme.
Erstellen eines Pair Plots
Das Erstellen eines Pair Plots mit seaborn
läuft darauf hinaus, seine pairplot()
-Funktion aufzurufen. Sein wichtigster und einziger erforderlicher Parameter ist data
, das ein DataFrame
-Objekt sein sollte. Hier ist ein Beispiel für Sie:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Hier ist iris_df
das DataFrame
, das wir in die pairplot()
-Funktion übergeben, und alles funktioniert einwandfrei. Die Parameter height
und aspect
geben einfach die Höhe und Breite (height * aspect
) jeder Facette (Seite) in Zoll an.
Hue
Ein weiterer Parameter, der erwähnenswert ist, ist hue
, der die Variable (Spaltenname) in data
angibt, um Plot-Aspekte auf verschiedene Farben abzubilden oder sogar separate Plots (auf einer Axes
) für jeden seiner Werte zu erstellen.
Hier ist ein Beispiel, um die Dinge klarer zu machen:
import seaborn as sns import matplotlib.pyplot as plt import warnings # Ignoring warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Sie können hier sofort den Unterschied erkennen. Zunächst einmal sind die Datenpunkte in jedem Streudiagramm entsprechend der Spezies gefärbt, zu der sie gehören (der entsprechende Wert in der 'species'
-Spalte). Diagonale Plots sind jetzt KDE-Plots (ein separater für jede der Spezies) anstelle der Histogramme.
Tatsächlich macht es bei einem Klassifikationsproblem oft Sinn, ein Paar-Plot mit dem hue
-Parameter auf die Zielvariable (kategorische Variable, die wir vorhersagen möchten) zu erstellen.
Ändern der Plot-Arten
Sie können auch andere Plots anstelle der Streudiagramme festlegen und andere diagonale Plots einstellen. Die Parameter kind
('scatter'
ist der Standardwert) und diag_kind
('auto'
ist der Standardwert, daher basiert seine Art auf der Anwesenheit des hue
-Parameters) werden zu diesem Zweck verwendet.
Lassen Sie uns nun unser Beispiel ändern:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter'
, 'kde'
, 'hist'
, 'reg'
sind mögliche Werte für den kind
-Parameter.
diag_kind
kann auf einen der folgenden Werte gesetzt werden:
'auto'
;'hist'
;'kde'
;None
.
Alles ist in dieser Hinsicht ähnlich der jointplot()
-Funktion.
Mehr zur pairplot()
-Funktion in ihrer Dokumentation.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein Paar-Diagramm zu erstellen.
- Setzen Sie die Daten für das Diagramm auf
penguins_df
über das erste Argument. - Setzen Sie
'sex'
als die Spalte, die die Diagrammaspekte auf verschiedene Farben abbildet, indem Sie das zweite Argument angeben. - Setzen Sie die nicht-diagonalen Diagramme auf eine Regressionslinie (
'reg'
) über das dritte Argument. - Setzen Sie
height
auf2
. - Setzen Sie
aspect
auf0.8
.
Es kann einige Minuten dauern, die Lösung zu überprüfen.
Lösung
Danke für Ihr Feedback!