Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Preprocessing-Pipeline | Feature Engineering für Machine Learning
Datenvorverarbeitung und Feature Engineering

bookHerausforderung: Preprocessing-Pipeline

Aufgabe

Swipe to start coding

Sie erhalten den Titanic-Datensatz aus der seaborn-Bibliothek. Ihre Aufgabe ist es, eine vollständige Preprocessing-Pipeline zu erstellen, die alle wesentlichen Datenumwandlungen vor dem maschinellen Lernen durchführt.

Folgen Sie diesen Schritten:

  1. Laden Sie den Datensatz mit sns.load_dataset("titanic").
  2. Behandeln Sie fehlende Werte:
  • Numerische Spalten → mit dem Mittelwert auffüllen.
  • Kategorische Spalten → mit dem Modus auffüllen.
  1. Kodieren Sie die kategorialen Merkmale sex und embarked mit pd.get_dummies().
  2. Skalieren Sie die numerischen Spalten age und fare mit StandardScaler.
  3. Erstellen Sie ein neues Merkmal family_size = sibsp + parch + 1.
  4. Fassen Sie alle Transformationen in einer Funktion namens preprocess_titanic(data) zusammen, die das final verarbeitete DataFrame zurückgibt.
  5. Weisen Sie den verarbeiteten Datensatz einer Variablen namens processed_data zu.

Geben Sie die ersten 5 Zeilen des finalen DataFrames aus.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 8.33

bookHerausforderung: Preprocessing-Pipeline

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie erhalten den Titanic-Datensatz aus der seaborn-Bibliothek. Ihre Aufgabe ist es, eine vollständige Preprocessing-Pipeline zu erstellen, die alle wesentlichen Datenumwandlungen vor dem maschinellen Lernen durchführt.

Folgen Sie diesen Schritten:

  1. Laden Sie den Datensatz mit sns.load_dataset("titanic").
  2. Behandeln Sie fehlende Werte:
  • Numerische Spalten → mit dem Mittelwert auffüllen.
  • Kategorische Spalten → mit dem Modus auffüllen.
  1. Kodieren Sie die kategorialen Merkmale sex und embarked mit pd.get_dummies().
  2. Skalieren Sie die numerischen Spalten age und fare mit StandardScaler.
  3. Erstellen Sie ein neues Merkmal family_size = sibsp + parch + 1.
  4. Fassen Sie alle Transformationen in einer Funktion namens preprocess_titanic(data) zusammen, die das final verarbeitete DataFrame zurückgibt.
  5. Weisen Sie den verarbeiteten Datensatz einer Variablen namens processed_data zu.

Geben Sie die ersten 5 Zeilen des finalen DataFrames aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 4
single

single

some-alt