Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Que Ferons-Nous Avec les Valeurs NaN? | Prétraitement des Données
Techniques Avancées dans Pandas
course content

Contenu du cours

Techniques Avancées dans Pandas

Techniques Avancées dans Pandas

1. Se Familiariser Avec l'Indexation et la Sélection de Données
2. Gestion des Conditions
3. Extraction de Données
4. Agrégation de Données
5. Prétraitement des Données

book
Que Ferons-Nous Avec les Valeurs NaN?

Dans le chapitre précédent, vous avez reçu le résultat :

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Le jeu de données contient 418 lignes. Regardez la colonne Cabin, où nous avons 327 valeurs manquantes. Il n'y a pas de sens à les remplir car nous avons peu d'informations ici. Donc, dans ce cas, la meilleure solution est de supprimer la colonne qui est inutile pour nous. L'une des raisons est que nous pouvons supprimer uniquement les lignes qui contiennent des valeurs manquantes, mais nous ne pouvons pas supprimer 327 lignes sur 418. Alors, voyons comment faire cela.

Pour supprimer une colonne, vous devez appliquer la méthode .drop() au jeu de données. La syntaxe est la suivante :

Explication :

  • .drop() - une méthode qui supprime des colonnes ;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argument de la fonction, où vous spécifiez le nom ou les noms des colonnes que vous souhaitez supprimer ;
  • inplace = True - argument utile de pandas qui nous permet de sauvegarder tous les changements. Vous pouvez l'utiliser dans d'autres fonctions aussi ; nous en apprendrons certaines plus tard.
Tâche

Swipe to start coding

Votre tâche est de supprimer la colonne avec le plus grand nombre de valeurs NaN. Suivez l'algorithme :

  1. Supprimez la colonne 'Cabin' en utilisant l'argument inplace = True.
  2. Affichez les 5 lignes aléatoires du jeu de données.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
toggle bottom row

book
Que Ferons-Nous Avec les Valeurs NaN?

Dans le chapitre précédent, vous avez reçu le résultat :

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Le jeu de données contient 418 lignes. Regardez la colonne Cabin, où nous avons 327 valeurs manquantes. Il n'y a pas de sens à les remplir car nous avons peu d'informations ici. Donc, dans ce cas, la meilleure solution est de supprimer la colonne qui est inutile pour nous. L'une des raisons est que nous pouvons supprimer uniquement les lignes qui contiennent des valeurs manquantes, mais nous ne pouvons pas supprimer 327 lignes sur 418. Alors, voyons comment faire cela.

Pour supprimer une colonne, vous devez appliquer la méthode .drop() au jeu de données. La syntaxe est la suivante :

Explication :

  • .drop() - une méthode qui supprime des colonnes ;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argument de la fonction, où vous spécifiez le nom ou les noms des colonnes que vous souhaitez supprimer ;
  • inplace = True - argument utile de pandas qui nous permet de sauvegarder tous les changements. Vous pouvez l'utiliser dans d'autres fonctions aussi ; nous en apprendrons certaines plus tard.
Tâche

Swipe to start coding

Votre tâche est de supprimer la colonne avec le plus grand nombre de valeurs NaN. Suivez l'algorithme :

  1. Supprimez la colonne 'Cabin' en utilisant l'argument inplace = True.
  2. Affichez les 5 lignes aléatoires du jeu de données.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt