Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Prétraitement du Jeu de Données | Concepts Fondamentaux
Analyse de Clusters avec Python
Section 2. Chapitre 6
single

single

bookDéfi : Prétraitement du Jeu de Données

Glissez pour afficher le menu

Tâche

Glissez pour commencer à coder

Un jeu de données synthétique est stocké dans la variable data. L'objectif est de traiter les valeurs manquantes et d'encoder correctement les variables catégorielles.

Procédure à suivre :

  • Remplacer les valeurs manquantes de la colonne 'Age' par la moyenne de cette colonne. Écraser la colonne d'origine avec le résultat.
  • Créer une instance de OneHotEncoder et la stocker dans la variable city_encoder. Veiller à spécifier drop='first' pour éviter le piège des variables fictives.
  • Par défaut, cet encodeur retourne une matrice creuse. Pour assurer la compatibilité avec Pandas par la suite, définir le paramètre sparse_output=False (ou sparse=False pour les versions antérieures) lors de l'initialisation, OU ajouter .toarray() lors de la transformation des données.
  • Encoder les valeurs de la colonne 'City' à l'aide de city_encoder.fit_transform() et stocker le tableau résultant dans la variable city_encoded.
  • Créer une instance de OrdinalEncoder et la stocker dans la variable income_encoder. Puisque les données présentent une hiérarchie naturelle, définir explicitement l'ordre à l'aide du paramètre categories (noter que 'Low' < 'Middle' < 'High').
  • Encoder les valeurs de la colonne 'Income' à l'aide de income_encoder et écraser la colonne 'Income' d'origine avec le résultat.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 6
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt