Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Die Kleinsten Werte Einer Spalte Finden | Daten Extrahieren
Fortgeschrittene Techniken in Pandas
course content

Kursinhalt

Fortgeschrittene Techniken in Pandas

Fortgeschrittene Techniken in Pandas

1. Vertraut Werden mit Indizierung und Datenauswahl
2. Umgang mit Bedingungen
3. Daten Extrahieren
4. Daten Aggregieren
5. Datenvorverarbeitung

book
Die Kleinsten Werte Einer Spalte Finden

Wir werden eine weitere wichtige Funktion lernen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Nicht überraschend kann pandas dies mit nur einer Zeile Code tun. Schauen Sie sich das Beispiel an, wie man die fünfzehn ältesten Autos abruft:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Wenn Sie nach einer Spalte und dann nach einer anderen sortieren möchten, setzen Sie einfach eine Liste mit den Spaltennamen in der erforderlichen Reihenfolge. Schauen Sie sich das Beispiel an, bei dem wir zuerst nach 'Year' und dann nach 'Engine_volume' sortieren. Dieser Code wird zuerst die 5 ältesten Autos extrahieren, und wenn die Jahre übereinstimmen, wird das Auto mit dem kleineren Wert in der Spalte 'Engine_volume' Vorrang haben:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Versuchen Sie, die beiden unten stehenden Beispiele zu vergleichen. Jetzt werden wir die Funktion ein wenig erweitern. Lassen Sie uns unsere Beispiele mit den 'Year'-Werten der Spalte zurückgeben. In unserer Spalte können die 'Year'-Werte wiederholt werden, daher wird unsere Funktion, wenn wir die zehn ältesten Autos mit der vorherigen Syntax ausgeben möchten, nur zehn Werte nehmen. Es ist ihr egal, ob der 11. oder 12. Wert derselbe ist wie der 10. Wir können das Argument keep = 'all' in die .nsmallest()-Methode einfügen, um solche Fälle zu verhindern. Schauen Sie sich das Beispiel an und versuchen Sie, es auszuführen, um den Unterschied zu sehen:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Aufgabe

Swipe to start coding

Endlich ist es Zeit zu üben! Hier sollten Sie diesem Algorithmus folgen:

  1. Rufen Sie Daten zu Autos ab, bei denen die Spaltenwerte 'Year' größer als 2010 sind.
  2. Extrahieren Sie die günstigsten 15 Autos (die 15 kleinsten Werte der Spalte 'Price'). Schließen Sie alle doppelten Werte der Spalte 'Price' ein.
  3. Geben Sie alle Werte des Datensatzes data_cheapest aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5
toggle bottom row

book
Die Kleinsten Werte Einer Spalte Finden

Wir werden eine weitere wichtige Funktion lernen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Nicht überraschend kann pandas dies mit nur einer Zeile Code tun. Schauen Sie sich das Beispiel an, wie man die fünfzehn ältesten Autos abruft:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Wenn Sie nach einer Spalte und dann nach einer anderen sortieren möchten, setzen Sie einfach eine Liste mit den Spaltennamen in der erforderlichen Reihenfolge. Schauen Sie sich das Beispiel an, bei dem wir zuerst nach 'Year' und dann nach 'Engine_volume' sortieren. Dieser Code wird zuerst die 5 ältesten Autos extrahieren, und wenn die Jahre übereinstimmen, wird das Auto mit dem kleineren Wert in der Spalte 'Engine_volume' Vorrang haben:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Versuchen Sie, die beiden unten stehenden Beispiele zu vergleichen. Jetzt werden wir die Funktion ein wenig erweitern. Lassen Sie uns unsere Beispiele mit den 'Year'-Werten der Spalte zurückgeben. In unserer Spalte können die 'Year'-Werte wiederholt werden, daher wird unsere Funktion, wenn wir die zehn ältesten Autos mit der vorherigen Syntax ausgeben möchten, nur zehn Werte nehmen. Es ist ihr egal, ob der 11. oder 12. Wert derselbe ist wie der 10. Wir können das Argument keep = 'all' in die .nsmallest()-Methode einfügen, um solche Fälle zu verhindern. Schauen Sie sich das Beispiel an und versuchen Sie, es auszuführen, um den Unterschied zu sehen:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Aufgabe

Swipe to start coding

Endlich ist es Zeit zu üben! Hier sollten Sie diesem Algorithmus folgen:

  1. Rufen Sie Daten zu Autos ab, bei denen die Spaltenwerte 'Year' größer als 2010 sind.
  2. Extrahieren Sie die günstigsten 15 Autos (die 15 kleinsten Werte der Spalte 'Price'). Schließen Sie alle doppelten Werte der Spalte 'Price' ein.
  3. Geben Sie alle Werte des Datensatzes data_cheapest aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt