Labelencoder
OrdinalEncoder
och OneHotEncoder
används vanligtvis för att koda egenskaper (variabeln X
). Dock kan även målvariabeln (y
) vara kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
används för att koda målvariabeln, oavsett om den är nominell eller ordinal.
ML-modeller tar inte hänsyn till ordningen på målet, vilket gör att det kan kodas som vilka numeriska värden som helst.
LabelEncoder
kodar målet till siffrorna 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovan kodar målet med hjälp av LabelEncoder
och använder sedan metoden .inverse_transform()
för att konvertera tillbaka till den ursprungliga representationen.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
Labelencoder
Svep för att visa menyn
OrdinalEncoder
och OneHotEncoder
används vanligtvis för att koda egenskaper (variabeln X
). Dock kan även målvariabeln (y
) vara kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
används för att koda målvariabeln, oavsett om den är nominell eller ordinal.
ML-modeller tar inte hänsyn till ordningen på målet, vilket gör att det kan kodas som vilka numeriska värden som helst.
LabelEncoder
kodar målet till siffrorna 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovan kodar målet med hjälp av LabelEncoder
och använder sedan metoden .inverse_transform()
för att konvertera tillbaka till den ursprungliga representationen.
Tack för dina kommentarer!