Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Coderen van Categorische Variabelen | Gegevens Preprocessen met Scikit-learn
ML-Introductie met Scikit-learn

bookUitdaging: Coderen van Categorische Variabelen

Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder je dient te gebruiken:

In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.

Hier volgt een herinnering aan de structuur van de dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.

Taak

Swipe to start coding

Encodeer alle categorische kenmerken. Gebruik one-hot encoding voor de kolommen 'island' en 'sex', en pas een label encoder (of vergelijkbare target encoder) toe op de kolom 'species'. Volg deze stappen om de codering te voltooien.

  1. Importeer OnehotEncoder en LabelEncoder.
  2. Initialiseer het encoder-object voor de kenmerken.
  3. Codeer de categorische kenmerk-kolommen met behulp van het feature_enc-object.
  4. Initialiseer het encoder-object voor de target.
  5. Codeer de target met behulp van het label_enc-object.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 8
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.13

bookUitdaging: Coderen van Categorische Variabelen

Veeg om het menu te tonen

Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder je dient te gebruiken:

In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.

Hier volgt een herinnering aan de structuur van de dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.

Taak

Swipe to start coding

Encodeer alle categorische kenmerken. Gebruik one-hot encoding voor de kolommen 'island' en 'sex', en pas een label encoder (of vergelijkbare target encoder) toe op de kolom 'species'. Volg deze stappen om de codering te voltooien.

  1. Importeer OnehotEncoder en LabelEncoder.
  2. Initialiseer het encoder-object voor de kenmerken.
  3. Codeer de categorische kenmerk-kolommen met behulp van het feature_enc-object.
  4. Initialiseer het encoder-object voor de target.
  5. Codeer de target met behulp van het label_enc-object.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

close

Awesome!

Completion rate improved to 3.13
Sectie 2. Hoofdstuk 8
single

single

some-alt