Udfordring: Kodning af Kategoriske Variabler
For at opsummere de foregående tre kapitler vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species'-kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.
Swipe to start coding
Kodér alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island' og 'sex', og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'. Følg disse trin for at fuldføre kodningen.
- Importér
OnehotEncoderogLabelEncoder. - Initialisér objektet til feature-encoder.
- Kod de kategoriske feature-kolonner ved hjælp af
feature_enc-objektet. - Initialisér objektet til target-encoder.
- Kod target ved hjælp af
label_enc-objektet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Udfordring: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species'-kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.
Swipe to start coding
Kodér alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island' og 'sex', og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'. Følg disse trin for at fuldføre kodningen.
- Importér
OnehotEncoderogLabelEncoder. - Initialisér objektet til feature-encoder.
- Kod de kategoriske feature-kolonner ved hjælp af
feature_enc-objektet. - Initialisér objektet til target-encoder.
- Kod target ved hjælp af
label_enc-objektet.
Løsning
Tak for dine kommentarer!
single