Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Codifica delle Variabili Categoriche | Preprocessing Dei Dati con Scikit-learn
Introduzione al ML con Scikit-Learn

bookSfida: Codifica delle Variabili Categoriche

Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder dovresti utilizzare:

In questa sfida, viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'), devono essere codificate.

Ecco un promemoria della struttura del dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.

Compito

Swipe to start coding

Codifica tutte le caratteristiche categoriche. Utilizza la one-hot encoding per le colonne 'island' e 'sex', e applica un label encoder (o un encoder target simile) per la colonna 'species'. Segui questi passaggi per completare la codifica.

  1. Importa OnehotEncoder e LabelEncoder.
  2. Inizializza l'oggetto encoder per le caratteristiche.
  3. Codifica le colonne delle caratteristiche categoriche utilizzando l'oggetto feature_enc.
  4. Inizializza l'oggetto encoder per il target.
  5. Codifica il target utilizzando l'oggetto label_enc.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 8
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookSfida: Codifica delle Variabili Categoriche

Scorri per mostrare il menu

Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder dovresti utilizzare:

In questa sfida, viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'), devono essere codificate.

Ecco un promemoria della struttura del dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.

Compito

Swipe to start coding

Codifica tutte le caratteristiche categoriche. Utilizza la one-hot encoding per le colonne 'island' e 'sex', e applica un label encoder (o un encoder target simile) per la colonna 'species'. Segui questi passaggi per completare la codifica.

  1. Importa OnehotEncoder e LabelEncoder.
  2. Inizializza l'oggetto encoder per le caratteristiche.
  3. Codifica le colonne delle caratteristiche categoriche utilizzando l'oggetto feature_enc.
  4. Inizializza l'oggetto encoder per il target.
  5. Codifica il target utilizzando l'oggetto label_enc.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

close

Awesome!

Completion rate improved to 3.13
Sezione 2. Capitolo 8
single

single

some-alt