Kursinhalt
Ultimative Visualisierung mit Python
Ultimative Visualisierung mit Python
Joint Plot
Joint Plot ist ein ziemlich einzigartiges Diagramm, da es mehrere Diagramme kombiniert. Grundsätzlich hat es standardmäßig drei Elemente:
- Histogramm oben, das die Verteilung einer bestimmten Variablen darstellt;
- Histogramm rechts, das die Verteilung einer anderen Variablen darstellt;
- Streudiagramm in der Mitte, das die Beziehung zwischen diesen beiden Variablen zeigt.
Hier ist ein Beispiel für ein Joint Plot:
Daten für das Joint Plot
seaborn
hat eine jointplot()
Funktion, die ähnlich wie countplot()
und kdeplot()
drei wichtigste Parameter hat:
data
;x
;y
.
Die Parameter x
und y
sind die Variablen, die uns interessieren (das rechte und obere Histogramm jeweils), sie können entweder array-ähnliche Objekte oder die Namen der Spalten eines DataFrame
sein (wenn wir auch den data
Parameter als DataFrame
setzen).
Schauen wir uns ein Beispiel an:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Wir haben gerade das Beispiel, das wir am Anfang hatten, nachgebildet, indem wir ein DataFrame
-Objekt für den data
-Parameter und die Namen der Spalten für x
und y
festgelegt haben.
Plot in der Mitte
Ein weiterer sehr nützlicher Parameter ist kind
, der das Diagramm angibt, das Sie in der Mitte haben. 'scatter'
ist der Standardwert. Hier sind andere mögliche Diagramme: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Fühlen Sie sich frei, mit verschiedenen Diagrammen zu experimentieren:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plot-Arten
Obwohl das Streudiagramm meist für das Diagramm in der Mitte verwendet wird, sind hier einige andere Diagramme nur zur Information:
'reg'
erstellt ein lineares Regressionsmodell, das zusammen mit dem Streudiagramm angezeigt wird, was nützlich ist, um zu überprüfen, ob zwei Variablen korreliert sind;'resid'
zeigt die Residuen einer linearen Regression (Dokumentation);'hist'
erstellt ein bivariates Histogramm (für zwei Variablen);'kde'
erstellt ein KDE-Diagramm;'hex'
erstellt ein Hexbin-Diagramm. Es ist ein Streudiagramm, bei dem hexagonale Bins anstelle einzelner Datenpunkte verwendet werden, und die Farbe jedes Bins zeigt an, wie viele Datenpunkte darin enthalten sind.
Wie üblich, zögern Sie nicht, weitere Parameter in der Dokumentation zu erkunden.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein Joint-Plot zu erstellen.
- Verwenden Sie
weather_df
als Daten für das Diagramm (das erste Argument). - Setzen Sie die
'Boston'
-Spalte als Variable für die x-Achse (das zweite Argument). - Setzen Sie die
'Seattle'
-Spalte als Variable für die y-Achse (das dritte Argument). - Setzen Sie das Diagramm in der Mitte so, dass es eine Regressionslinie hat (das letzte Argument).
Lösung
Danke für Ihr Feedback!
Joint Plot
Joint Plot ist ein ziemlich einzigartiges Diagramm, da es mehrere Diagramme kombiniert. Grundsätzlich hat es standardmäßig drei Elemente:
- Histogramm oben, das die Verteilung einer bestimmten Variablen darstellt;
- Histogramm rechts, das die Verteilung einer anderen Variablen darstellt;
- Streudiagramm in der Mitte, das die Beziehung zwischen diesen beiden Variablen zeigt.
Hier ist ein Beispiel für ein Joint Plot:
Daten für das Joint Plot
seaborn
hat eine jointplot()
Funktion, die ähnlich wie countplot()
und kdeplot()
drei wichtigste Parameter hat:
data
;x
;y
.
Die Parameter x
und y
sind die Variablen, die uns interessieren (das rechte und obere Histogramm jeweils), sie können entweder array-ähnliche Objekte oder die Namen der Spalten eines DataFrame
sein (wenn wir auch den data
Parameter als DataFrame
setzen).
Schauen wir uns ein Beispiel an:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Wir haben gerade das Beispiel, das wir am Anfang hatten, nachgebildet, indem wir ein DataFrame
-Objekt für den data
-Parameter und die Namen der Spalten für x
und y
festgelegt haben.
Plot in der Mitte
Ein weiterer sehr nützlicher Parameter ist kind
, der das Diagramm angibt, das Sie in der Mitte haben. 'scatter'
ist der Standardwert. Hier sind andere mögliche Diagramme: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Fühlen Sie sich frei, mit verschiedenen Diagrammen zu experimentieren:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plot-Arten
Obwohl das Streudiagramm meist für das Diagramm in der Mitte verwendet wird, sind hier einige andere Diagramme nur zur Information:
'reg'
erstellt ein lineares Regressionsmodell, das zusammen mit dem Streudiagramm angezeigt wird, was nützlich ist, um zu überprüfen, ob zwei Variablen korreliert sind;'resid'
zeigt die Residuen einer linearen Regression (Dokumentation);'hist'
erstellt ein bivariates Histogramm (für zwei Variablen);'kde'
erstellt ein KDE-Diagramm;'hex'
erstellt ein Hexbin-Diagramm. Es ist ein Streudiagramm, bei dem hexagonale Bins anstelle einzelner Datenpunkte verwendet werden, und die Farbe jedes Bins zeigt an, wie viele Datenpunkte darin enthalten sind.
Wie üblich, zögern Sie nicht, weitere Parameter in der Dokumentation zu erkunden.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein Joint-Plot zu erstellen.
- Verwenden Sie
weather_df
als Daten für das Diagramm (das erste Argument). - Setzen Sie die
'Boston'
-Spalte als Variable für die x-Achse (das zweite Argument). - Setzen Sie die
'Seattle'
-Spalte als Variable für die y-Achse (das dritte Argument). - Setzen Sie das Diagramm in der Mitte so, dass es eine Regressionslinie hat (das letzte Argument).
Lösung
Danke für Ihr Feedback!