Kursinhalt
Fortgeschrittene Techniken in Pandas
Fortgeschrittene Techniken in Pandas
Umgang mit Pivot-Tabellen
Python hat ein Analogon der Methode .groupby()
, das zum gleichen Ergebnis führen kann. Es liegt an Ihnen, welche Funktion Sie verwenden möchten. Lernen wir es anhand eines Beispiels. Mit der folgenden Funktion, genannt .pivot_table()
, berechnen wir die Mittelwerte der Spalte 'Length'
, die denselben Wert in der Spalte 'Flight'
haben:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Erklärung:
pd.pivot_table()
- Funktion, die Pivot-Tabellen erstellt;data
- Datenrahmen, den wir verwenden;values = 'Length'
- dem Argumentvalues
weisen wir Spalten zu, die dieselbe Gruppe haben, für die wir die Berechnung des Durchschnitts, Maximums usw. anwenden werden. Wenn Sie nach mehreren Spalten gruppieren möchten, setzen Sie sie in die Liste; die Reihenfolge ist nicht entscheidend;index = 'Flight'
-index
ist ein Argument, dem Sie den Namen einer Spalte oder Spalten zuweisen, die Sie gruppieren möchten. Wenn Sie nach mehreren Spalten gruppieren möchten, setzen Sie sie in die Liste; die Reihenfolge ist entscheidend, wie bei der.groupby()
-Funktion;aggfunc = 'mean'
- dasselbe wieagg
in der.groupby()
-Methode,aggfunc
hat genau dieselbe Syntax wieagg
. Sie können hier mehrere Funktionen angeben, indem Sie sie in die Liste setzen, um Funktionen für verschiedene Spalten mit geschweiften Klammern anzugeben.
War alles klar?
Danke für Ihr Feedback!
Abschnitt 4. Kapitel 5