Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Kodning af Kategoriske Variabler | Forbehandling af Data med Scikit-learn
ML Introduktion med Scikit-learn

bookUdfordring: Kodning af Kategoriske Variabler

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species' kolonnen), skal kodes.

Her er en påmindelse om datasættets struktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.

Opgave

Swipe to start coding

Du får en DataFrame ved navn df, som indeholder pingvindata.
Din opgave er at kode alle kategoriske funktioner, så dataene kan bruges i en maskinlæringsmodel.

  1. Importér klasserne OneHotEncoder og LabelEncoder fra sklearn.preprocessing.
  2. Adskil feature-matrixen X og målvariablen y fra DataFrame.
  3. Opret et OneHotEncoder-objekt og anvend det på kolonnerne 'island' og 'sex' i X.
  4. Erstat de oprindelige kategoriske kolonner med de kodede kolonner.
  5. Opret et LabelEncoder-objekt og anvend det på kolonnen 'species' for at kode målvariablen y.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Kodning af Kategoriske Variabler

Stryg for at vise menuen

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring er penguins dataset (uden manglende værdier) tilgængeligt. Alle kategoriske variable, inklusive målet ('species' kolonnen), skal kodes.

Her er en påmindelse om datasættets struktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.

Opgave

Swipe to start coding

Du får en DataFrame ved navn df, som indeholder pingvindata.
Din opgave er at kode alle kategoriske funktioner, så dataene kan bruges i en maskinlæringsmodel.

  1. Importér klasserne OneHotEncoder og LabelEncoder fra sklearn.preprocessing.
  2. Adskil feature-matrixen X og målvariablen y fra DataFrame.
  3. Opret et OneHotEncoder-objekt og anvend det på kolonnerne 'island' og 'sex' i X.
  4. Erstat de oprindelige kategoriske kolonner med de kodede kolonner.
  5. Opret et LabelEncoder-objekt og anvend det på kolonnen 'species' for at kode målvariablen y.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

some-alt