Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Koding av Kategoriske Variabler | Forbehandling av Data med Scikit-learn
ML-Introduksjon med Scikit-learn

bookUtfordring: Koding av Kategoriske Variabler

For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:

I denne utfordringen får du penguins dataset (uten manglende verdier). Alle kategoriske funksjoner, inkludert målet ('species'-kolonnen), må kodes.

Her er en påminnelse om datastruktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.

Oppgave

Swipe to start coding

Koder alle kategoriske variabler. Bruk one-hot encoding for kolonnene 'island' og 'sex', og bruk en label encoder (eller lignende mål-encoder) for kolonnen 'species'. Følg disse trinnene for å fullføre kodingen.

  1. Importer OnehotEncoder og LabelEncoder.
  2. Initialiser objektet for feature-encoder.
  3. Kode de kategoriske feature-kolonnene ved å bruke feature_enc-objektet.
  4. Initialiser objektet for target-encoder.
  5. Kode målet ved å bruke label_enc-objektet.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 8
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Koding av Kategoriske Variabler

Sveip for å vise menyen

For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:

I denne utfordringen får du penguins dataset (uten manglende verdier). Alle kategoriske funksjoner, inkludert målet ('species'-kolonnen), må kodes.

Her er en påminnelse om datastruktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.

Oppgave

Swipe to start coding

Koder alle kategoriske variabler. Bruk one-hot encoding for kolonnene 'island' og 'sex', og bruk en label encoder (eller lignende mål-encoder) for kolonnen 'species'. Følg disse trinnene for å fullføre kodingen.

  1. Importer OnehotEncoder og LabelEncoder.
  2. Initialiser objektet for feature-encoder.
  3. Kode de kategoriske feature-kolonnene ved å bruke feature_enc-objektet.
  4. Initialiser objektet for target-encoder.
  5. Kode målet ved å bruke label_enc-objektet.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

close

Awesome!

Completion rate improved to 3.13
Seksjon 2. Kapittel 8
single

single

some-alt