Contenu du cours
Premiers Pas Avec Pandas
Premiers Pas Avec Pandas
Trouver des Valeurs Nulles
Les DataFrames contiennent souvent des valeurs manquantes, représentées par None
ou NaN
. Lorsqu'on travaille avec des DataFrames, il est essentiel d'identifier ces valeurs manquantes car elles peuvent fausser les calculs, mener à des analyses inexactes et compromettre la fiabilité des résultats.
Les traiter assure l'intégrité des données et améliore la performance des tâches comme l'analyse statistique et l'apprentissage automatique. À cette fin, pandas offre des méthodes spécifiques.
La première de ces méthodes est isna()
, qui renvoie un DataFrame booléen. Dans ce contexte, une valeur True
indique une valeur manquante dans le DataFrame, tandis qu'une valeur False
suggère que la valeur est présente.
Pour plus de clarté, nous appliquerons cette méthode sur le DataFrame animals
. La méthode isna()
renverra un DataFrame rempli de valeurs True
/False
, où chaque valeur True
représente une valeur manquante dans le DataFrame animals
.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
La deuxième méthode est isnull()
. Elle se comporte de manière identique à la précédente, sans différence notable entre elles.
Swipe to start coding
Votre objectif est d'identifier les valeurs manquantes dans un DataFrame nommé wine_data
.
Solution
Merci pour vos commentaires !
Trouver des Valeurs Nulles
Les DataFrames contiennent souvent des valeurs manquantes, représentées par None
ou NaN
. Lorsqu'on travaille avec des DataFrames, il est essentiel d'identifier ces valeurs manquantes car elles peuvent fausser les calculs, mener à des analyses inexactes et compromettre la fiabilité des résultats.
Les traiter assure l'intégrité des données et améliore la performance des tâches comme l'analyse statistique et l'apprentissage automatique. À cette fin, pandas offre des méthodes spécifiques.
La première de ces méthodes est isna()
, qui renvoie un DataFrame booléen. Dans ce contexte, une valeur True
indique une valeur manquante dans le DataFrame, tandis qu'une valeur False
suggère que la valeur est présente.
Pour plus de clarté, nous appliquerons cette méthode sur le DataFrame animals
. La méthode isna()
renverra un DataFrame rempli de valeurs True
/False
, où chaque valeur True
représente une valeur manquante dans le DataFrame animals
.
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
La deuxième méthode est isnull()
. Elle se comporte de manière identique à la précédente, sans différence notable entre elles.
Swipe to start coding
Votre objectif est d'identifier les valeurs manquantes dans un DataFrame nommé wine_data
.
Solution
Merci pour vos commentaires !