Was Machen Wir Mit Den NaN-Werten?

Im vorherigen Kapitel hast du folgendes Ergebnis erhalten:


PassengerId	0
Survived	0
Pclass	0
Name	0
Sex	0
Age	86
SibSp	0
Parch	0
Ticket	0
Fare	1
Cabin	327
Embarked	0

Der Datensatz umfasst 418 Zeilen. Betrachte die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir zwar nur die Zeilen mit fehlenden Werten löschen könnten, aber nicht 327 von 418 Zeilen entfernen können. Schauen wir uns also an, wie das funktioniert.

Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax lautet wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

.drop() – Methode zum Löschen von Spalten;
columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;
inplace = True – nützliches Argument von pandas, das alle Änderungen speichert. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3

single

Swipe um das Menü anzuzeigen

Im vorherigen Kapitel hast du folgendes Ergebnis erhalten:


PassengerId	0
Survived	0
Pclass	0
Name	0
Sex	0
Age	86
SibSp	0
Parch	0
Ticket	0
Fare	1
Cabin	327
Embarked	0

Der Datensatz umfasst 418 Zeilen. Betrachte die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir zwar nur die Zeilen mit fehlenden Werten löschen könnten, aber nicht 327 von 418 Zeilen entfernen können. Schauen wir uns also an, wie das funktioniert.

Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax lautet wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

.drop() – Methode zum Löschen von Spalten;
columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;
inplace = True – nützliches Argument von pandas, das alle Änderungen speichert. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Ihre Aufgabe besteht darin, die Spalte mit der höchsten Anzahl an NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:

Löschen Sie die Spalte 'Cabin' unter Verwendung des Arguments inplace = True.
Geben Sie 5 zufällige Zeilen des Datensatzes aus.

Lösung

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden

War alles klar?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3

single

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen