Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele LabelEncoder | Datan Esikäsittely Scikit-learnilla
Koneoppimisen Perusteet Scikit-learnilla

bookLabelEncoder

OrdinalEncoder ja OneHotEncoder käytetään tyypillisesti piirteiden (muuttujan X) koodaukseen. Kuitenkin myös kohdemuuttuja (y) voi olla kategorinen.

123456789
import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
copy

LabelEncoder-luokkaa käytetään kohdemuuttujan koodaukseen, riippumatta siitä, onko se nominaalinen vai ordinaalinen.

ML-mallit eivät ota huomioon kohteen järjestystä, joten se voidaan koodata millä tahansa numeerisilla arvoilla. LabelEncoder koodaa kohteen numeroiksi 0, 1, ... .

1234567891011121314
import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
copy

Yllä oleva koodi koodaa kohteen käyttäen LabelEncoder-luokkaa ja käyttää sitten .inverse_transform()-metodia muuntaakseen sen takaisin alkuperäiseen esitysmuotoon.

question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 7

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between LabelEncoder and OneHotEncoder?

Why do we use LabelEncoder for the target variable instead of OneHotEncoder?

Can you show how to interpret the encoded values from LabelEncoder?

Awesome!

Completion rate improved to 3.13

bookLabelEncoder

Pyyhkäise näyttääksesi valikon

OrdinalEncoder ja OneHotEncoder käytetään tyypillisesti piirteiden (muuttujan X) koodaukseen. Kuitenkin myös kohdemuuttuja (y) voi olla kategorinen.

123456789
import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
copy

LabelEncoder-luokkaa käytetään kohdemuuttujan koodaukseen, riippumatta siitä, onko se nominaalinen vai ordinaalinen.

ML-mallit eivät ota huomioon kohteen järjestystä, joten se voidaan koodata millä tahansa numeerisilla arvoilla. LabelEncoder koodaa kohteen numeroiksi 0, 1, ... .

1234567891011121314
import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
copy

Yllä oleva koodi koodaa kohteen käyttäen LabelEncoder-luokkaa ja käyttää sitten .inverse_transform()-metodia muuntaakseen sen takaisin alkuperäiseen esitysmuotoon.

question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 7
some-alt