Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Kodning af Kategoriske Variabler | Forbehandling af Data med Scikit-learn
Introduktion til Maskinlæring med Python

bookUdfordring: Kodning af Kategoriske Variabler

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.

Opgave

Swipe to start coding

Du har fået en DataFrame df. Kod alle kategoriske kolonner:

  1. Importér OneHotEncoder og LabelEncoder fra sklearn.preprocessing.
  2. Opdel dataene i X (features) og y (target).
  3. Opret en OneHotEncoder og anvend den på kolonnerne 'island' og 'sex' i X.
  4. Erstat de originale kolonner med deres kodede versioner.
  5. Brug LabelEncoder på kolonnen 'species' for at kode y.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What are the steps to encode the categorical features and target in this dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

How do I choose which encoder to use for each column in the penguins dataset?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Kodning af Kategoriske Variabler

Stryg for at vise menuen

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.

Opgave

Swipe to start coding

Du har fået en DataFrame df. Kod alle kategoriske kolonner:

  1. Importér OneHotEncoder og LabelEncoder fra sklearn.preprocessing.
  2. Opdel dataene i X (features) og y (target).
  3. Opret en OneHotEncoder og anvend den på kolonnerne 'island' og 'sex' i X.
  4. Erstat de originale kolonner med deres kodede versioner.
  5. Brug LabelEncoder på kolonnen 'species' for at kode y.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

some-alt