LabelEncoder
OrdinalEncoder
og OneHotEncoder
brukes vanligvis til å kode funksjoner (variabelen X
). Imidlertid kan målvariabelen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
brukes til å kode målvariabelen, uavhengig av om den er nominell eller ordinal.
ML-modeller tar ikke hensyn til rekkefølgen på målet, noe som gjør at det kan kodes som vilkårlige numeriske verdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjelp av LabelEncoder
og bruker deretter metoden .inverse_transform()
for å konvertere det tilbake til den opprinnelige representasjonen.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
LabelEncoder
Sveip for å vise menyen
OrdinalEncoder
og OneHotEncoder
brukes vanligvis til å kode funksjoner (variabelen X
). Imidlertid kan målvariabelen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
brukes til å kode målvariabelen, uavhengig av om den er nominell eller ordinal.
ML-modeller tar ikke hensyn til rekkefølgen på målet, noe som gjør at det kan kodes som vilkårlige numeriske verdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjelp av LabelEncoder
og bruker deretter metoden .inverse_transform()
for å konvertere det tilbake til den opprinnelige representasjonen.
Takk for tilbakemeldingene dine!