Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Erstellung Einer Pipeline | Pipelines
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Erstellung Einer Pipeline

In dieser Aufgabe sollen alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes kombiniert werden.

  1. Entfernen Sie die zwei Zeilen mit unzureichenden Daten.
  2. Erstellen Sie eine Pipeline, die Kodierung, Imputation und Skalierung umfasst.

Es müssen nur zwei Spalten kodiert werden: 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.

Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden sollen.

Aufgabe

Swipe to start coding

  1. Importieren der richtigen Funktion zur Erstellung einer Pipeline.
  2. Erstellen eines ColumnTransformer mit dem OneHotEncoder, der nur auf die Spalten 'sex' und 'island' angewendet wird.
  3. Sicherstellen, dass alle anderen Spalten unverändert bleiben.
  4. Erstellen einer Pipeline, die den soeben erstellten ct, einen SimpleImputer, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einen StandardScaler als letzten Schritt enthält.
  5. Transformation von X mit der erstellten pipe.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Erstellung Einer Pipeline

Swipe um das Menü anzuzeigen

In dieser Aufgabe sollen alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes kombiniert werden.

  1. Entfernen Sie die zwei Zeilen mit unzureichenden Daten.
  2. Erstellen Sie eine Pipeline, die Kodierung, Imputation und Skalierung umfasst.

Es müssen nur zwei Spalten kodiert werden: 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.

Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden sollen.

Aufgabe

Swipe to start coding

  1. Importieren der richtigen Funktion zur Erstellung einer Pipeline.
  2. Erstellen eines ColumnTransformer mit dem OneHotEncoder, der nur auf die Spalten 'sex' und 'island' angewendet wird.
  3. Sicherstellen, dass alle anderen Spalten unverändert bleiben.
  4. Erstellen einer Pipeline, die den soeben erstellten ct, einen SimpleImputer, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einen StandardScaler als letzten Schritt enthält.
  5. Transformation von X mit der erstellten pipe.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

close

Awesome!

Completion rate improved to 3.13
Abschnitt 3. Kapitel 4
single

single

some-alt