Udfordring: Kodning af Kategoriske Variabler
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species' kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.
Swipe to start coding
Du får en DataFrame ved navn df, som indeholder pingvindata.
Din opgave er at kode alle kategoriske funktioner, så dataene kan bruges i en maskinlæringsmodel.
- Importér klasserne
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Adskil feature-matrixen
Xog målvariablenyfraDataFrame. - Opret et
OneHotEncoder-objekt og anvend det på kolonnerne'island'og'sex'iX. - Erstat de oprindelige kategoriske kolonner med de kodede kolonner.
- Opret et
LabelEncoder-objekt og anvend det på kolonnen'species'for at kode målvariableny.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Udfordring: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species' kolonnen), skal kodes.
Her er en påmindelse om datasættets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.
Swipe to start coding
Du får en DataFrame ved navn df, som indeholder pingvindata.
Din opgave er at kode alle kategoriske funktioner, så dataene kan bruges i en maskinlæringsmodel.
- Importér klasserne
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Adskil feature-matrixen
Xog målvariablenyfraDataFrame. - Opret et
OneHotEncoder-objekt og anvend det på kolonnerne'island'og'sex'iX. - Erstat de oprindelige kategoriske kolonner med de kodede kolonner.
- Opret et
LabelEncoder-objekt og anvend det på kolonnen'species'for at kode målvariableny.
Løsning
Tak for dine kommentarer!
single