Herausforderung: Erstellung Einer Pipeline
In dieser Aufgabe sollen alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv
-Datensatzes kombiniert werden.
- Entfernen Sie die zwei Zeilen mit unzureichenden Daten.
- Erstellen Sie eine Pipeline, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden: 'sex'
und 'island'
. Da nicht das gesamte X
kodiert werden soll, ist die Verwendung eines ColumnTransformer
erforderlich. Anschließend wird der SimpleImputer
und der StandardScaler
auf das gesamte X
angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer()
und make_pipeline()
, die verwendet werden sollen.
Swipe to start coding
- Importieren der richtigen Funktion zur Erstellung einer Pipeline.
- Erstellen eines
ColumnTransformer
mit demOneHotEncoder
, der nur auf die Spalten'sex'
und'island'
angewendet wird. - Sicherstellen, dass alle anderen Spalten unverändert bleiben.
- Erstellen einer Pipeline, die den soeben erstellten
ct
, einenSimpleImputer
, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einenStandardScaler
als letzten Schritt enthält. - Transformation von
X
mit der erstelltenpipe
.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Herausforderung: Erstellung Einer Pipeline
Swipe um das Menü anzuzeigen
In dieser Aufgabe sollen alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv
-Datensatzes kombiniert werden.
- Entfernen Sie die zwei Zeilen mit unzureichenden Daten.
- Erstellen Sie eine Pipeline, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden: 'sex'
und 'island'
. Da nicht das gesamte X
kodiert werden soll, ist die Verwendung eines ColumnTransformer
erforderlich. Anschließend wird der SimpleImputer
und der StandardScaler
auf das gesamte X
angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer()
und make_pipeline()
, die verwendet werden sollen.
Swipe to start coding
- Importieren der richtigen Funktion zur Erstellung einer Pipeline.
- Erstellen eines
ColumnTransformer
mit demOneHotEncoder
, der nur auf die Spalten'sex'
und'island'
angewendet wird. - Sicherstellen, dass alle anderen Spalten unverändert bleiben.
- Erstellen einer Pipeline, die den soeben erstellten
ct
, einenSimpleImputer
, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einenStandardScaler
als letzten Schritt enthält. - Transformation von
X
mit der erstelltenpipe
.
Lösung
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.13single