Udfordring: Kodning af Kategoriske Variabler
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring stilles penguins dataset (uden manglende værdier) til rådighed. Alle kategoriske funktioner, inklusive målet ('species'
kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island'
og 'sex'
er kategoriske funktioner, og 'species'
er et kategorisk mål.
Swipe to start coding
Kod alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island'
og 'sex'
, og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'
. Følg disse trin for at fuldføre kodningen.
- Importér
OnehotEncoder
ogLabelEncoder
. - Initialisér objektet til kodning af funktioner.
- Kod de kategoriske funktionskolonner ved hjælp af
feature_enc
-objektet. - Initialisér objektet til kodning af target.
- Kod target ved hjælp af
label_enc
-objektet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Udfordring: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring stilles penguins dataset (uden manglende værdier) til rådighed. Alle kategoriske funktioner, inklusive målet ('species'
kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island'
og 'sex'
er kategoriske funktioner, og 'species'
er et kategorisk mål.
Swipe to start coding
Kod alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island'
og 'sex'
, og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'
. Følg disse trin for at fuldføre kodningen.
- Importér
OnehotEncoder
ogLabelEncoder
. - Initialisér objektet til kodning af funktioner.
- Kod de kategoriske funktionskolonner ved hjælp af
feature_enc
-objektet. - Initialisér objektet til kodning af target.
- Kod target ved hjælp af
label_enc
-objektet.
Løsning
Tak for dine kommentarer!
Awesome!
Completion rate improved to 3.13single