Aprenda Codificador de Rótulos | Pré-Processamento de Dados com Scikit-Learn

Deslize para mostrar o menu

O OrdinalEncoder e o OneHotEncoder são normalmente utilizados para codificar características (a variável X). No entanto, a variável alvo (y) também pode ser categórica.


              123456789
            
import pandas as pd

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)

print(y)
print('All values: ', y.unique())

O LabelEncoder é utilizado para codificar o alvo, independentemente de ser nominal ou ordinal.

Modelos de ML não consideram a ordem do alvo, permitindo que ele seja codificado como quaisquer valores numéricos. O LabelEncoder codifica o alvo em números 0, 1, ... .


              1234567891011121314
            
import pandas as pd
from sklearn.preprocessing import LabelEncoder

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)
# Initialize a LabelEncoder object and encode the y variable
label_enc = LabelEncoder()
y = label_enc.fit_transform(y)
print(y)
# Decode the y variable back
y_decoded = label_enc.inverse_transform(y)
print(y_decoded)

O código acima codifica o alvo utilizando o LabelEncoder e, em seguida, utiliza o método .inverse_transform() para convertê-lo de volta à representação original.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 7

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 2. Capítulo 7