Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Encodeur d'Étiquettes | Prétraitement des Données avec Scikit-learn
Introduction au ML Avec Scikit-Learn

bookEncodeur d'Étiquettes

L'OrdinalEncoder et l'OneHotEncoder sont généralement utilisés pour encoder les caractéristiques (la variable X). Cependant, la variable cible (y) peut également être catégorielle.

123456789
import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
copy

Le LabelEncoder est utilisé pour encoder la cible, qu'elle soit nominale ou ordinale.

Les modèles d'apprentissage automatique ne tiennent pas compte de l'ordre de la cible, ce qui permet de l'encoder sous n'importe quelle valeur numérique. LabelEncoder encode la cible en nombres 0, 1, ... .

1234567891011121314
import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
copy

Le code ci-dessus encode la cible à l'aide de LabelEncoder puis utilise la méthode .inverse_transform() pour la reconvertir dans sa représentation d'origine.

question mark

Choisissez l'énoncé correct.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 7

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain the difference between LabelEncoder and OneHotEncoder?

Why do we use LabelEncoder for the target variable instead of OneHotEncoder?

Can you show how to interpret the encoded values from LabelEncoder?

Awesome!

Completion rate improved to 3.13

bookEncodeur d'Étiquettes

Glissez pour afficher le menu

L'OrdinalEncoder et l'OneHotEncoder sont généralement utilisés pour encoder les caractéristiques (la variable X). Cependant, la variable cible (y) peut également être catégorielle.

123456789
import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
copy

Le LabelEncoder est utilisé pour encoder la cible, qu'elle soit nominale ou ordinale.

Les modèles d'apprentissage automatique ne tiennent pas compte de l'ordre de la cible, ce qui permet de l'encoder sous n'importe quelle valeur numérique. LabelEncoder encode la cible en nombres 0, 1, ... .

1234567891011121314
import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
copy

Le code ci-dessus encode la cible à l'aide de LabelEncoder puis utilise la méthode .inverse_transform() pour la reconvertir dans sa représentation d'origine.

question mark

Choisissez l'énoncé correct.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 7
some-alt