Utfordring: Koding av Kategoriske Variabler
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:
I denne utfordringen får du penguins-datasettet (uten manglende verdier). Alle kategoriske variabler, inkludert målet ('species'-kolonnen), må kodes.
Her er en påminnelse om datastrukturen:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.
Swipe to start coding
Koder alle kategoriske variabler. Bruk one-hot encoding for kolonnene 'island' og 'sex', og bruk en label encoder (eller lignende target encoder) for kolonnen 'species'. Følg disse trinnene for å fullføre kodingen.
- Importer
OnehotEncoderogLabelEncoder. - Initialiser objektet for feature-enkoding.
- Koder de kategoriske feature-kolonnene ved å bruke
feature_enc-objektet. - Initialiser objektet for target-enkoding.
- Koder target ved å bruke
label_enc-objektet.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Utfordring: Koding av Kategoriske Variabler
Sveip for å vise menyen
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:
I denne utfordringen får du penguins-datasettet (uten manglende verdier). Alle kategoriske variabler, inkludert målet ('species'-kolonnen), må kodes.
Her er en påminnelse om datastrukturen:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.
Swipe to start coding
Koder alle kategoriske variabler. Bruk one-hot encoding for kolonnene 'island' og 'sex', og bruk en label encoder (eller lignende target encoder) for kolonnen 'species'. Følg disse trinnene for å fullføre kodingen.
- Importer
OnehotEncoderogLabelEncoder. - Initialiser objektet for feature-enkoding.
- Koder de kategoriske feature-kolonnene ved å bruke
feature_enc-objektet. - Initialiser objektet for target-enkoding.
- Koder target ved å bruke
label_enc-objektet.
Løsning
Takk for tilbakemeldingene dine!
single