Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Nettoyage des Données | Principes Essentiels du Nettoyage des Données
Prétraitement des Données et Ingénierie des Variables

bookDéfi : Nettoyage des Données

Tâche

Swipe to start coding

Vous disposez du jeu de données Titanic chargé via la bibliothèque Seaborn. Votre tâche consiste à nettoyer ce jeu de données à l'aide de pandas en effectuant les étapes suivantes :

  1. Charger le jeu de données avec sns.load_dataset("titanic").
  2. Remplacer les valeurs manquantes dans la colonne age par la moyenne de cette colonne.
  3. Remplacer les valeurs manquantes dans la colonne embarked par la valeur la plus fréquente (mode).
  4. Supprimer les lignes dupliquées.
  5. Supprimer les valeurs aberrantes dans la colonne fare en utilisant la méthode IQR.

Retourner le jeu de données nettoyé final sous forme de DataFrame nommé cleaned_data.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 8.33

bookDéfi : Nettoyage des Données

Glissez pour afficher le menu

Tâche

Swipe to start coding

Vous disposez du jeu de données Titanic chargé via la bibliothèque Seaborn. Votre tâche consiste à nettoyer ce jeu de données à l'aide de pandas en effectuant les étapes suivantes :

  1. Charger le jeu de données avec sns.load_dataset("titanic").
  2. Remplacer les valeurs manquantes dans la colonne age par la moyenne de cette colonne.
  3. Remplacer les valeurs manquantes dans la colonne embarked par la valeur la plus fréquente (mode).
  4. Supprimer les lignes dupliquées.
  5. Supprimer les valeurs aberrantes dans la colonne fare en utilisant la méthode IQR.

Retourner le jeu de données nettoyé final sous forme de DataFrame nommé cleaned_data.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4
single

single

some-alt