Kursinhalt
Fortgeschrittene Techniken in Pandas
Fortgeschrittene Techniken in Pandas
Die Kleinsten Werte Einer Spalte Finden
Wir werden eine weitere wichtige Funktion lernen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Nicht überraschend kann pandas dies mit nur einer Zeile Code tun. Schauen Sie sich das Beispiel an, wie man die fünfzehn ältesten Autos abruft:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Wenn Sie nach einer Spalte und dann nach einer anderen sortieren möchten, setzen Sie einfach eine Liste mit den Spaltennamen in der erforderlichen Reihenfolge. Schauen Sie sich das Beispiel an, bei dem wir zuerst nach 'Year'
und dann nach 'Engine_volume'
sortieren. Dieser Code wird zuerst die 5
ältesten Autos extrahieren, und wenn die Jahre übereinstimmen, wird das Auto mit dem kleineren Wert in der Spalte 'Engine_volume'
Vorrang haben:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Versuchen Sie, die beiden unten stehenden Beispiele zu vergleichen. Jetzt werden wir die Funktion ein wenig erweitern. Lassen Sie uns unsere Beispiele mit den 'Year'
-Werten der Spalte zurückgeben. In unserer Spalte können die 'Year'
-Werte wiederholt werden, daher wird unsere Funktion, wenn wir die zehn ältesten Autos mit der vorherigen Syntax ausgeben möchten, nur zehn Werte nehmen. Es ist ihr egal, ob der 11. oder 12. Wert derselbe ist wie der 10. Wir können das Argument keep = 'all'
in die .nsmallest()
-Methode einfügen, um solche Fälle zu verhindern. Schauen Sie sich das Beispiel an und versuchen Sie, es auszuführen, um den Unterschied zu sehen:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Endlich ist es Zeit zu üben! Hier sollten Sie diesem Algorithmus folgen:
- Rufen Sie Daten zu Autos ab, bei denen die Spaltenwerte
'Year'
größer als2010
sind. - Extrahieren Sie die günstigsten
15
Autos (die15
kleinsten Werte der Spalte'Price'
). Schließen Sie alle doppelten Werte der Spalte'Price'
ein. - Geben Sie alle Werte des Datensatzes
data_cheapest
aus.
Lösung
Danke für Ihr Feedback!
Die Kleinsten Werte Einer Spalte Finden
Wir werden eine weitere wichtige Funktion lernen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Nicht überraschend kann pandas dies mit nur einer Zeile Code tun. Schauen Sie sich das Beispiel an, wie man die fünfzehn ältesten Autos abruft:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Wenn Sie nach einer Spalte und dann nach einer anderen sortieren möchten, setzen Sie einfach eine Liste mit den Spaltennamen in der erforderlichen Reihenfolge. Schauen Sie sich das Beispiel an, bei dem wir zuerst nach 'Year'
und dann nach 'Engine_volume'
sortieren. Dieser Code wird zuerst die 5
ältesten Autos extrahieren, und wenn die Jahre übereinstimmen, wird das Auto mit dem kleineren Wert in der Spalte 'Engine_volume'
Vorrang haben:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Versuchen Sie, die beiden unten stehenden Beispiele zu vergleichen. Jetzt werden wir die Funktion ein wenig erweitern. Lassen Sie uns unsere Beispiele mit den 'Year'
-Werten der Spalte zurückgeben. In unserer Spalte können die 'Year'
-Werte wiederholt werden, daher wird unsere Funktion, wenn wir die zehn ältesten Autos mit der vorherigen Syntax ausgeben möchten, nur zehn Werte nehmen. Es ist ihr egal, ob der 11. oder 12. Wert derselbe ist wie der 10. Wir können das Argument keep = 'all'
in die .nsmallest()
-Methode einfügen, um solche Fälle zu verhindern. Schauen Sie sich das Beispiel an und versuchen Sie, es auszuführen, um den Unterschied zu sehen:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Endlich ist es Zeit zu üben! Hier sollten Sie diesem Algorithmus folgen:
- Rufen Sie Daten zu Autos ab, bei denen die Spaltenwerte
'Year'
größer als2010
sind. - Extrahieren Sie die günstigsten
15
Autos (die15
kleinsten Werte der Spalte'Price'
). Schließen Sie alle doppelten Werte der Spalte'Price'
ein. - Geben Sie alle Werte des Datensatzes
data_cheapest
aus.
Lösung
Danke für Ihr Feedback!