Kursinhalt
Pandas Erste Schritte
Pandas Erste Schritte
Nullwerte Finden
DataFrames enthalten oft fehlende Werte, die als None
oder NaN
dargestellt werden. Beim Arbeiten mit DataFrames ist es wichtig, diese fehlenden Werte zu identifizieren, da sie Berechnungen verfälschen, zu ungenauen Analysen führen und die Zuverlässigkeit der Ergebnisse beeinträchtigen können.
Ihre Behandlung gewährleistet die Datenintegrität und verbessert die Leistung von Aufgaben wie statistischer Analyse und maschinellem Lernen. Zu diesem Zweck bietet pandas spezifische Methoden an.
Die erste dieser Methoden ist isna()
, die einen booleschen DataFrame zurückgibt. In diesem Kontext zeigt ein True
-Wert einen fehlenden Wert im DataFrame an, während ein False
-Wert darauf hindeutet, dass der Wert vorhanden ist.
Zur Verdeutlichung werden wir diese Methode auf den animals
DataFrame anwenden. Die isna()
-Methode gibt einen DataFrame zurück, der mit True
/False
-Werten gefüllt ist, wobei jeder True
-Wert einen fehlenden Wert im animals
DataFrame darstellt.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Die zweite Methode ist isnull()
. Sie verhält sich identisch zur vorherigen, ohne erkennbaren Unterschied zwischen ihnen.
Swipe to start coding
Ihr Ziel ist es, die fehlenden Werte in einem gegebenen DataFrame namens wine_data
zu identifizieren.
Lösung
Danke für Ihr Feedback!
Nullwerte Finden
DataFrames enthalten oft fehlende Werte, die als None
oder NaN
dargestellt werden. Beim Arbeiten mit DataFrames ist es wichtig, diese fehlenden Werte zu identifizieren, da sie Berechnungen verfälschen, zu ungenauen Analysen führen und die Zuverlässigkeit der Ergebnisse beeinträchtigen können.
Ihre Behandlung gewährleistet die Datenintegrität und verbessert die Leistung von Aufgaben wie statistischer Analyse und maschinellem Lernen. Zu diesem Zweck bietet pandas spezifische Methoden an.
Die erste dieser Methoden ist isna()
, die einen booleschen DataFrame zurückgibt. In diesem Kontext zeigt ein True
-Wert einen fehlenden Wert im DataFrame an, während ein False
-Wert darauf hindeutet, dass der Wert vorhanden ist.
Zur Verdeutlichung werden wir diese Methode auf den animals
DataFrame anwenden. Die isna()
-Methode gibt einen DataFrame zurück, der mit True
/False
-Werten gefüllt ist, wobei jeder True
-Wert einen fehlenden Wert im animals
DataFrame darstellt.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
Die zweite Methode ist isnull()
. Sie verhält sich identisch zur vorherigen, ohne erkennbaren Unterschied zwischen ihnen.
Swipe to start coding
Ihr Ziel ist es, die fehlenden Werte in einem gegebenen DataFrame namens wine_data
zu identifizieren.
Lösung
Danke für Ihr Feedback!