Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Encodage des Variables Catégorielles | Prétraitement des Données avec Scikit-learn
Introduction à l'Apprentissage Automatique avec Python

bookDéfi : Encodage des Variables Catégorielles

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :

  1. Importez OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez les données en X (caractéristiques) et y (cible).
  3. Créez un OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez ces colonnes d'origine par leurs versions encodées.
  5. Utilisez LabelEncoder sur la colonne 'species' pour encoder y.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookDéfi : Encodage des Variables Catégorielles

Glissez pour afficher le menu

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :

  1. Importez OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez les données en X (caractéristiques) et y (cible).
  3. Créez un OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez ces colonnes d'origine par leurs versions encodées.
  5. Utilisez LabelEncoder sur la colonne 'species' pour encoder y.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

some-alt