Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Was Werden Wir Mit Den NaN-Werten Tun? | Datenvorverarbeitung
Fortgeschrittene Techniken in Pandas

bookWas Werden Wir Mit Den NaN-Werten Tun?

Im vorherigen Kapitel erhielten Sie das folgende Ergebnis:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher die beste Lösung, die für uns sinnlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen löschen könnten, die fehlende Werte enthalten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.

Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax ist wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

  • .drop() – Methode zum Löschen von Spalten;
  • columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;
  • inplace = True – nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Aufgabe

Swipe to start coding

Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:

  1. Löschen Sie die Spalte 'Cabin' mit dem Argument inplace = True.
  2. Geben Sie 5 zufällige Zeilen des Datensatzes aus.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.03

bookWas Werden Wir Mit Den NaN-Werten Tun?

Swipe um das Menü anzuzeigen

Im vorherigen Kapitel erhielten Sie das folgende Ergebnis:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher die beste Lösung, die für uns sinnlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen löschen könnten, die fehlende Werte enthalten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.

Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax ist wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

  • .drop() – Methode zum Löschen von Spalten;
  • columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;
  • inplace = True – nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Aufgabe

Swipe to start coding

Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:

  1. Löschen Sie die Spalte 'Cabin' mit dem Argument inplace = True.
  2. Geben Sie 5 zufällige Zeilen des Datensatzes aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

some-alt