Labelencoder
Gli OrdinalEncoder
e OneHotEncoder
sono generalmente utilizzati per codificare le feature (la variabile X
). Tuttavia, anche la variabile target (y
) può essere categorica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Il LabelEncoder
viene utilizzato per codificare il target, indipendentemente dal fatto che sia nominale o ordinale.
I modelli di ML non considerano l'ordine del target, permettendo che venga codificato con qualsiasi valore numerico.
LabelEncoder
codifica il target in numeri 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Il codice sopra codifica il target utilizzando LabelEncoder
e poi utilizza il metodo .inverse_transform()
per convertirlo nuovamente nella rappresentazione originale.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
Labelencoder
Scorri per mostrare il menu
Gli OrdinalEncoder
e OneHotEncoder
sono generalmente utilizzati per codificare le feature (la variabile X
). Tuttavia, anche la variabile target (y
) può essere categorica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Il LabelEncoder
viene utilizzato per codificare il target, indipendentemente dal fatto che sia nominale o ordinale.
I modelli di ML non considerano l'ordine del target, permettendo che venga codificato con qualsiasi valore numerico.
LabelEncoder
codifica il target in numeri 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Il codice sopra codifica il target utilizzando LabelEncoder
e poi utilizza il metodo .inverse_transform()
per convertirlo nuovamente nella rappresentazione originale.
Grazie per i tuoi commenti!