Sfida: Creazione di una Pipeline
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.
- Rimuovere le due righe con dati insufficienti.
- Costruire un pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.
Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che verranno utilizzate.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformerapplicando ilOneHotEncodersolo alle colonne'sex'e'island'. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ctappena creato, unSimpleImputerche riempie i valori mancanti con il valore più frequente e unoStandardScalercome ultimo passaggio. - Trasformare
Xutilizzando lapipecreata.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Sfida: Creazione di una Pipeline
Scorri per mostrare il menu
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.
- Rimuovere le due righe con dati insufficienti.
- Costruire un pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.
Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che verranno utilizzate.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformerapplicando ilOneHotEncodersolo alle colonne'sex'e'island'. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ctappena creato, unSimpleImputerche riempie i valori mancanti con il valore più frequente e unoStandardScalercome ultimo passaggio. - Trasformare
Xutilizzando lapipecreata.
Soluzione
Grazie per i tuoi commenti!
single