Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Kodning af Kategoriske Variabler | Forbehandling af Data med Scikit-learn
ML Introduktion med Scikit-learn

bookUdfordring: Kodning af Kategoriske Variabler

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring stilles penguins dataset (uden manglende værdier) til rådighed. Alle kategoriske funktioner, inklusive målet ('species' kolonnen), skal kodes.

Her er en påmindelse om datasættets struktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske funktioner, og 'species' er et kategorisk mål.

Opgave

Swipe to start coding

Kod alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island' og 'sex', og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'. Følg disse trin for at fuldføre kodningen.

  1. Importér OnehotEncoder og LabelEncoder.
  2. Initialisér objektet til kodning af funktioner.
  3. Kod de kategoriske funktionskolonner ved hjælp af feature_enc-objektet.
  4. Initialisér objektet til kodning af target.
  5. Kod target ved hjælp af label_enc-objektet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Kodning af Kategoriske Variabler

Stryg for at vise menuen

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring stilles penguins dataset (uden manglende værdier) til rådighed. Alle kategoriske funktioner, inklusive målet ('species' kolonnen), skal kodes.

Her er en påmindelse om datasættets struktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske funktioner, og 'species' er et kategorisk mål.

Opgave

Swipe to start coding

Kod alle kategoriske funktioner. Brug one-hot encoding til kolonnerne 'island' og 'sex', og anvend en label encoder (eller lignende target encoder) til kolonnen 'species'. Følg disse trin for at fuldføre kodningen.

  1. Importér OnehotEncoder og LabelEncoder.
  2. Initialisér objektet til kodning af funktioner.
  3. Kod de kategoriske funktionskolonner ved hjælp af feature_enc-objektet.
  4. Initialisér objektet til kodning af target.
  5. Kod target ved hjælp af label_enc-objektet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

close

Awesome!

Completion rate improved to 3.13
Sektion 2. Kapitel 8
single

single

some-alt