LabelEncoder
O OrdinalEncoder
e o OneHotEncoder
são normalmente utilizados para codificar características (a variável X
). No entanto, a variável alvo (y
) também pode ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
O LabelEncoder
é utilizado para codificar o alvo, independentemente de ser nominal ou ordinal.
Modelos de ML não consideram a ordem do alvo, permitindo que ele seja codificado como quaisquer valores numéricos.
O LabelEncoder
codifica o alvo em números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
O código acima codifica o alvo usando o LabelEncoder
e, em seguida, utiliza o método .inverse_transform()
para convertê-lo de volta à representação original.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
LabelEncoder
Deslize para mostrar o menu
O OrdinalEncoder
e o OneHotEncoder
são normalmente utilizados para codificar características (a variável X
). No entanto, a variável alvo (y
) também pode ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
O LabelEncoder
é utilizado para codificar o alvo, independentemente de ser nominal ou ordinal.
Modelos de ML não consideram a ordem do alvo, permitindo que ele seja codificado como quaisquer valores numéricos.
O LabelEncoder
codifica o alvo em números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
O código acima codifica o alvo usando o LabelEncoder
e, em seguida, utiliza o método .inverse_transform()
para convertê-lo de volta à representação original.
Obrigado pelo seu feedback!