Was Werden Wir Mit Den NaN-Werten Tun?
Im vorherigen Kapitel erhielten Sie das folgende Ergebnis:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher die beste Lösung, die für uns sinnlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen löschen könnten, die fehlende Werte enthalten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.
Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax ist wie folgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Erläuterung:
.drop()– Methode zum Löschen von Spalten;columns = 'column_name'odercolumns = ['column_1', 'column_2']– Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;inplace = True– nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Swipe to start coding
Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:
- Löschen Sie die Spalte
'Cabin'mit dem Argumentinplace = True. - Geben Sie
5zufällige Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.03
Was Werden Wir Mit Den NaN-Werten Tun?
Swipe um das Menü anzuzeigen
Im vorherigen Kapitel erhielten Sie das folgende Ergebnis:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher die beste Lösung, die für uns sinnlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen löschen könnten, die fehlende Werte enthalten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.
Um eine Spalte zu löschen, muss die Methode .drop() auf den Datensatz angewendet werden. Die Syntax ist wie folgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Erläuterung:
.drop()– Methode zum Löschen von Spalten;columns = 'column_name'odercolumns = ['column_1', 'column_2']– Argument der Funktion, in dem der Name oder die Namen der zu löschenden Spalten angegeben werden;inplace = True– nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Swipe to start coding
Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:
- Löschen Sie die Spalte
'Cabin'mit dem Argumentinplace = True. - Geben Sie
5zufällige Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!
single