Contenu du cours
Techniques Avancées dans Pandas
Techniques Avancées dans Pandas
1. Se Familiariser Avec l'Indexation et la Sélection de Données
5. Prétraitement des Données
Vérification des Valeurs ManquantesCalcul du Nombre de Valeurs ManquantesQue Ferons-Nous Avec les Valeurs NaN?Comment Supprimer Uniquement les Valeurs NaN ?Remplir les Valeurs ManquantesGestion des Variables CatégoriellesVérification du Type de ColonneGestion d'une Colonne IncorrecteRenommer la Colonne
Définir une Condition
Dans cette section, nous allons apprendre à extraire des données en utilisant des conditions spécifiques, mais d'abord, je veux que vous examiniez l'ensemble de données que nous allons utiliser. Il comprend des données sur les astéroïdes :
id
- Identifiant unique pour chaque astéroïde ;name
- Nom donné par la NASA ;est_diameter_min
- Diamètre estimé minimum en kilomètres ;est_diameter_max
- Diamètre estimé maximum en kilomètres ;absolute_magnitude
- Décrit la luminosité de l'objet ;hazardous
- Fonction booléenne qui indique si l'astéroïde est dangereux ou non.
Vous êtes déjà familier avec l'attribut .loc[]
, mais ici nous allons élargir ses possibilités.
Un des outils les plus utiles est de définir des conditions sur une colonne pour extraire des valeurs spécifiques. Ainsi, vous placez simplement la condition de la colonne à l'intérieur de l'attribut .loc[]
. Regardez les différentes conditions et sorties.
data.loc[data['est_diameter_max'] < 0.005].head()
- extrait les cinq premières lignes où les valeurs de la colonne'est_diameter_max'
sont inférieures à0.005
;data.loc[data['absolute_magnitude'] >= 30].head()
- extrait les cinq premières lignes où les valeurs de la colonne'absolute_magnitude'
sont supérieures ou égales à30
.
Tout était clair ?
Merci pour vos commentaires !
Section 2. Chapitre 1