Kursinhalt
Fortgeschrittene Techniken in Pandas
Fortgeschrittene Techniken in Pandas
Ausfüllen der Fehlenden Werte
Das Löschen fehlender Werte ist nicht der einzige Weg, um sie loszuwerden. Sie können auch alle NaNs durch einen definierten Wert ersetzen, zum Beispiel durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie werden dies im Kurs Lernen von Statistik mit Python lernen.
Schauen Sie sich das Beispiel an, wie fehlende Werte in der Spalte 'Age'
mit dem Medianwert dieser Spalte gefüllt werden:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erklärung:
value = data['Age'].median()
- mit dem Argumentvalue
geben wir der Methode.fillna()
an, was mit denNaN
-Werten zu tun ist. In diesem Fall haben wir die Methode.fillna()
auf die Spalte'Age'
angewendet und alle fehlenden Werte durch den Median der Spalte ersetzt;inplace=True
- das Argument, das wir verwenden können, um Änderungen zu speichern.
Swipe to start coding
Eine der häufigsten Methoden, fehlende Werte zu füllen, besteht darin, sie durch den Mittelwert der Spalte zu ersetzen. Ihre Aufgabe besteht darin, die NaN
-Werte in der Spalte 'Age'
durch den Mittelwert der Spalte zu ersetzen (unter Verwendung des Arguments inplace = True
). Geben Sie dann die Summe der fehlenden Werte in der Spalte 'Age'
aus.
Lösung
Danke für Ihr Feedback!
Ausfüllen der Fehlenden Werte
Das Löschen fehlender Werte ist nicht der einzige Weg, um sie loszuwerden. Sie können auch alle NaNs durch einen definierten Wert ersetzen, zum Beispiel durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie werden dies im Kurs Lernen von Statistik mit Python lernen.
Schauen Sie sich das Beispiel an, wie fehlende Werte in der Spalte 'Age'
mit dem Medianwert dieser Spalte gefüllt werden:
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erklärung:
value = data['Age'].median()
- mit dem Argumentvalue
geben wir der Methode.fillna()
an, was mit denNaN
-Werten zu tun ist. In diesem Fall haben wir die Methode.fillna()
auf die Spalte'Age'
angewendet und alle fehlenden Werte durch den Median der Spalte ersetzt;inplace=True
- das Argument, das wir verwenden können, um Änderungen zu speichern.
Swipe to start coding
Eine der häufigsten Methoden, fehlende Werte zu füllen, besteht darin, sie durch den Mittelwert der Spalte zu ersetzen. Ihre Aufgabe besteht darin, die NaN
-Werte in der Spalte 'Age'
durch den Mittelwert der Spalte zu ersetzen (unter Verwendung des Arguments inplace = True
). Geben Sie dann die Summe der fehlenden Werte in der Spalte 'Age'
aus.
Lösung
Danke für Ihr Feedback!