Herausforderung: Preprocessing-Pipeline
Swipe to start coding
Sie erhalten den Titanic-Datensatz aus der seaborn-Bibliothek.
Ihre Aufgabe ist es, eine vollständige Preprocessing-Pipeline zu erstellen, die alle wesentlichen Datenumwandlungen vor dem maschinellen Lernen durchführt.
Folgen Sie diesen Schritten:
- Laden Sie den Datensatz mit
sns.load_dataset("titanic"). - Behandeln Sie fehlende Werte:
- Numerische Spalten → mit dem Mittelwert auffüllen.
- Kategorische Spalten → mit dem Modus auffüllen.
- Kodieren Sie die kategorialen Merkmale
sexundembarkedmitpd.get_dummies(). - Skalieren Sie die numerischen Spalten
ageundfaremitStandardScaler. - Erstellen Sie ein neues Merkmal
family_size = sibsp + parch + 1. - Fassen Sie alle Transformationen in einer Funktion namens
preprocess_titanic(data)zusammen, die das final verarbeitete DataFrame zurückgibt. - Weisen Sie den verarbeiteten Datensatz einer Variablen namens
processed_datazu.
Geben Sie die ersten 5 Zeilen des finalen DataFrames aus.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 8.33
Herausforderung: Preprocessing-Pipeline
Swipe um das Menü anzuzeigen
Swipe to start coding
Sie erhalten den Titanic-Datensatz aus der seaborn-Bibliothek.
Ihre Aufgabe ist es, eine vollständige Preprocessing-Pipeline zu erstellen, die alle wesentlichen Datenumwandlungen vor dem maschinellen Lernen durchführt.
Folgen Sie diesen Schritten:
- Laden Sie den Datensatz mit
sns.load_dataset("titanic"). - Behandeln Sie fehlende Werte:
- Numerische Spalten → mit dem Mittelwert auffüllen.
- Kategorische Spalten → mit dem Modus auffüllen.
- Kodieren Sie die kategorialen Merkmale
sexundembarkedmitpd.get_dummies(). - Skalieren Sie die numerischen Spalten
ageundfaremitStandardScaler. - Erstellen Sie ein neues Merkmal
family_size = sibsp + parch + 1. - Fassen Sie alle Transformationen in einer Funktion namens
preprocess_titanic(data)zusammen, die das final verarbeitete DataFrame zurückgibt. - Weisen Sie den verarbeiteten Datensatz einer Variablen namens
processed_datazu.
Geben Sie die ersten 5 Zeilen des finalen DataFrames aus.
Lösung
Danke für Ihr Feedback!
single