Sfida: Codifica delle Variabili Categoriche
Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder dovresti utilizzare:
In questa sfida, viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'
), devono essere codificate.
Ecco un promemoria della struttura del dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island'
e 'sex'
sono feature categoriche e 'species'
è un target categorico.
Swipe to start coding
Codifica tutte le caratteristiche categoriche. Utilizza la one-hot encoding per le colonne 'island'
e 'sex'
, e applica un label encoder (o un encoder target simile) per la colonna 'species'
. Segui questi passaggi per completare la codifica.
- Importa
OnehotEncoder
eLabelEncoder
. - Inizializza l'oggetto encoder per le caratteristiche.
- Codifica le colonne delle caratteristiche categoriche utilizzando l'oggetto
feature_enc
. - Inizializza l'oggetto encoder per il target.
- Codifica il target utilizzando l'oggetto
label_enc
.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Sfida: Codifica delle Variabili Categoriche
Scorri per mostrare il menu
Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder dovresti utilizzare:
In questa sfida, viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'
), devono essere codificate.
Ecco un promemoria della struttura del dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island'
e 'sex'
sono feature categoriche e 'species'
è un target categorico.
Swipe to start coding
Codifica tutte le caratteristiche categoriche. Utilizza la one-hot encoding per le colonne 'island'
e 'sex'
, e applica un label encoder (o un encoder target simile) per la colonna 'species'
. Segui questi passaggi per completare la codifica.
- Importa
OnehotEncoder
eLabelEncoder
. - Inizializza l'oggetto encoder per le caratteristiche.
- Codifica le colonne delle caratteristiche categoriche utilizzando l'oggetto
feature_enc
. - Inizializza l'oggetto encoder per il target.
- Codifica il target utilizzando l'oggetto
label_enc
.
Soluzione
Grazie per i tuoi commenti!
Awesome!
Completion rate improved to 3.13single