Uitdaging: Coderen van Categorische Variabelen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging werkt u met de penguins dataset (geen ontbrekende waarden). Alle categorische kenmerken — inclusief de target 'species' — moeten worden gecodeerd voor gebruik in ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame df. Encodeer alle categorische kolommen:
- Importeer
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Splits de data in
X(features) eny(doelvariabele). - Maak een
OneHotEncoderaan en pas deze toe op de kolommen'island'en'sex'inX. - Vervang deze originele kolommen door hun gecodeerde versies.
- Gebruik
LabelEncoderop de kolom'species'omyte coderen.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 3.13
Uitdaging: Coderen van Categorische Variabelen
Veeg om het menu te tonen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging werkt u met de penguins dataset (geen ontbrekende waarden). Alle categorische kenmerken — inclusief de target 'species' — moeten worden gecodeerd voor gebruik in ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame df. Encodeer alle categorische kolommen:
- Importeer
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Splits de data in
X(features) eny(doelvariabele). - Maak een
OneHotEncoderaan en pas deze toe op de kolommen'island'en'sex'inX. - Vervang deze originele kolommen door hun gecodeerde versies.
- Gebruik
LabelEncoderop de kolom'species'omyte coderen.
Oplossing
Bedankt voor je feedback!
single