Kursinhalt
Ultimative Visualisierung mit Python
Ultimative Visualisierung mit Python
Countplot
Ein Countplot ist ein Diagramm, das Spalten (Balken) erstellt, die die Anzahl der Einträge für jede Kategorie einer kategorischen Liste darstellen. Es kann auch als Histogramm einer kategorialen Variablen betrachtet werden. Schauen wir uns ein Beispiel für ein Countplot an:
Hier repräsentiert jede Spalte die Anzahl der Titanic-Passagiere jeder Klasse. Sie haben vielleicht schon bemerkt, dass dieses Diagramm dem Balkendiagramm sehr ähnlich ist. Tatsächlich ist es eine eher spezifische Art von Balkendiagramm, das die Häufigkeit jeder Kategorie darstellt.
Hinweis
Sie müssen immer noch das
pyplot
-Modul vonmatplotlib
importieren und die Funktionplt.show()
verwenden, um die mitseaborn
erstellten Diagramme anzuzeigen.
Um ein Countplot mit seaborn
zu erstellen, sollten Sie die Funktion countplot()
verwenden. Es gibt mehrere mögliche Optionen, um unsere Daten an diese Funktion zu übergeben.
Übergeben eines 1D-Arrays
Die erste Option besteht darin, einfach den Wert für den x
-Parameter zu übergeben, der eine Art Array sein kann:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
Wie Sie sehen können, zählt die Funktion einfach die Vorkommen jedes einzigartigen Elements in der Liste und erstellt eine Spalte mit der entsprechenden Höhe für jedes von ihnen.
Hinweis
Wir können auch den y-Parameter anstelle von x verwenden, um die Ausrichtung des Diagramms von vertikal auf horizontal zu ändern.
Übergeben eines 2D-Objekts
Eine weitere Option ist die Verwendung des data
-Parameters in Kombination mit dem x
- oder y
-Parameter. Dieser Ansatz eignet sich für die Arbeit mit pandas
DataFrames. Sie können eine Liste von Arrays oder ein DataFrame
als Wert für data
übergeben. Für x
oder y
können Sie einen Spaltennamen im DataFrame
angeben, zum Beispiel:
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
Unsere Funktion in diesem Beispiel erstellt ein Countplot basierend auf der 'class'
-Spalte eines Titanic-DataFrame
und zählt die Anzahl der Einträge für jeden eindeutigen Wert in dieser Spalte.
Swipe to start coding
- Importieren Sie die
seaborn
-Bibliothek mit dem Aliassns
. - Importieren Sie das Modul
matplotlib.pyplot
mit dem Aliasplt
. - Verwenden Sie die richtige Funktion, um ein Countplot zu erstellen.
- Verwenden Sie
diamonds
als erstes Argument, um dasDataFrame
anzugeben. - Verwenden Sie die
'cut'
-Spalte desdiamonds
DataFrame als Kategorien für das Countplot und zeigen Sie die Kategorien über das zweite Argument auf der y-Achse an. - Zeigen Sie das Diagramm mit der richtigen Funktion an.
Lösung
Danke für Ihr Feedback!
Countplot
Ein Countplot ist ein Diagramm, das Spalten (Balken) erstellt, die die Anzahl der Einträge für jede Kategorie einer kategorischen Liste darstellen. Es kann auch als Histogramm einer kategorialen Variablen betrachtet werden. Schauen wir uns ein Beispiel für ein Countplot an:
Hier repräsentiert jede Spalte die Anzahl der Titanic-Passagiere jeder Klasse. Sie haben vielleicht schon bemerkt, dass dieses Diagramm dem Balkendiagramm sehr ähnlich ist. Tatsächlich ist es eine eher spezifische Art von Balkendiagramm, das die Häufigkeit jeder Kategorie darstellt.
Hinweis
Sie müssen immer noch das
pyplot
-Modul vonmatplotlib
importieren und die Funktionplt.show()
verwenden, um die mitseaborn
erstellten Diagramme anzuzeigen.
Um ein Countplot mit seaborn
zu erstellen, sollten Sie die Funktion countplot()
verwenden. Es gibt mehrere mögliche Optionen, um unsere Daten an diese Funktion zu übergeben.
Übergeben eines 1D-Arrays
Die erste Option besteht darin, einfach den Wert für den x
-Parameter zu übergeben, der eine Art Array sein kann:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
Wie Sie sehen können, zählt die Funktion einfach die Vorkommen jedes einzigartigen Elements in der Liste und erstellt eine Spalte mit der entsprechenden Höhe für jedes von ihnen.
Hinweis
Wir können auch den y-Parameter anstelle von x verwenden, um die Ausrichtung des Diagramms von vertikal auf horizontal zu ändern.
Übergeben eines 2D-Objekts
Eine weitere Option ist die Verwendung des data
-Parameters in Kombination mit dem x
- oder y
-Parameter. Dieser Ansatz eignet sich für die Arbeit mit pandas
DataFrames. Sie können eine Liste von Arrays oder ein DataFrame
als Wert für data
übergeben. Für x
oder y
können Sie einen Spaltennamen im DataFrame
angeben, zum Beispiel:
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
Unsere Funktion in diesem Beispiel erstellt ein Countplot basierend auf der 'class'
-Spalte eines Titanic-DataFrame
und zählt die Anzahl der Einträge für jeden eindeutigen Wert in dieser Spalte.
Swipe to start coding
- Importieren Sie die
seaborn
-Bibliothek mit dem Aliassns
. - Importieren Sie das Modul
matplotlib.pyplot
mit dem Aliasplt
. - Verwenden Sie die richtige Funktion, um ein Countplot zu erstellen.
- Verwenden Sie
diamonds
als erstes Argument, um dasDataFrame
anzugeben. - Verwenden Sie die
'cut'
-Spalte desdiamonds
DataFrame als Kategorien für das Countplot und zeigen Sie die Kategorien über das zweite Argument auf der y-Achse an. - Zeigen Sie das Diagramm mit der richtigen Funktion an.
Lösung
Danke für Ihr Feedback!