Udfordring: Kodning af Kategoriske Variabler
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.
Swipe to start coding
Du har fået en DataFrame df. Kod alle kategoriske kolonner:
- Importér
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Opdel dataene i
X(features) ogy(target). - Opret en
OneHotEncoderog anvend den på kolonnerne'island'og'sex'iX. - Erstat de originale kolonner med deres kodede versioner.
- Brug
LabelEncoderpå kolonnen'species'for at kodey.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Awesome!
Completion rate improved to 3.13
Udfordring: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.
Swipe to start coding
Du har fået en DataFrame df. Kod alle kategoriske kolonner:
- Importér
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Opdel dataene i
X(features) ogy(target). - Opret en
OneHotEncoderog anvend den på kolonnerne'island'og'sex'iX. - Erstat de originale kolonner med deres kodede versioner.
- Brug
LabelEncoderpå kolonnen'species'for at kodey.
Løsning
Tak for dine kommentarer!
single