Sfida: Creazione di una Pipeline
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv
.
- Rimuovere le due righe con dati insufficienti.
- Costruire una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex'
e 'island'
. Poiché non si desidera codificare l'intero X
, è necessario utilizzare un ColumnTransformer
. Successivamente, applicare il SimpleImputer
e il StandardScaler
all'intero X
.
Ecco un promemoria delle funzioni make_column_transformer()
e make_pipeline()
che utilizzerai.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformer
applicando ilOneHotEncoder
solo alle colonne'sex'
e'island'
. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ct
appena creato, unSimpleImputer
che riempie i valori mancanti con il valore più frequente e unoStandardScaler
come ultimo passaggio. - Trasformare
X
utilizzando lapipe
creata.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Sfida: Creazione di una Pipeline
Scorri per mostrare il menu
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv
.
- Rimuovere le due righe con dati insufficienti.
- Costruire una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex'
e 'island'
. Poiché non si desidera codificare l'intero X
, è necessario utilizzare un ColumnTransformer
. Successivamente, applicare il SimpleImputer
e il StandardScaler
all'intero X
.
Ecco un promemoria delle funzioni make_column_transformer()
e make_pipeline()
che utilizzerai.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformer
applicando ilOneHotEncoder
solo alle colonne'sex'
e'island'
. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ct
appena creato, unSimpleImputer
che riempie i valori mancanti con il valore più frequente e unoStandardScaler
come ultimo passaggio. - Trasformare
X
utilizzando lapipe
creata.
Soluzione
Grazie per i tuoi commenti!
Awesome!
Completion rate improved to 3.13single