Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Preprocessing-Pijplijn | Feature Engineering voor Machine Learning
Data Preprocessing en Feature Engineering

bookUitdaging: Preprocessing-Pijplijn

Taak

Swipe to start coding

Je krijgt de Titanic dataset uit de seaborn-bibliotheek. Je opdracht is om een volledige preprocessing-pijplijn te bouwen die alle essentiële datatransformaties uitvoert die vóór machine learning worden gebruikt.

Volg deze stappen:

  1. Laad de dataset met sns.load_dataset("titanic").
  2. Behandel ontbrekende waarden:
  • Numerieke kolommen → opvullen met het gemiddelde.
  • Categorische kolommen → opvullen met de modus.
  1. Encodeer de categorische kenmerken sex en embarked met pd.get_dummies().
  2. Schaal de numerieke kolommen age en fare met StandardScaler.
  3. Maak een nieuw kenmerk aan: family_size = sibsp + parch + 1.
  4. Combineer alle transformaties in een functie genaamd preprocess_titanic(data) die de uiteindelijk verwerkte DataFrame retourneert.
  5. Wijs de verwerkte dataset toe aan een variabele genaamd processed_data.

Print de eerste 5 rijen van de uiteindelijke DataFrame.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 8.33

bookUitdaging: Preprocessing-Pijplijn

Veeg om het menu te tonen

Taak

Swipe to start coding

Je krijgt de Titanic dataset uit de seaborn-bibliotheek. Je opdracht is om een volledige preprocessing-pijplijn te bouwen die alle essentiële datatransformaties uitvoert die vóór machine learning worden gebruikt.

Volg deze stappen:

  1. Laad de dataset met sns.load_dataset("titanic").
  2. Behandel ontbrekende waarden:
  • Numerieke kolommen → opvullen met het gemiddelde.
  • Categorische kolommen → opvullen met de modus.
  1. Encodeer de categorische kenmerken sex en embarked met pd.get_dummies().
  2. Schaal de numerieke kolommen age en fare met StandardScaler.
  3. Maak een nieuw kenmerk aan: family_size = sibsp + parch + 1.
  4. Combineer alle transformaties in een functie genaamd preprocess_titanic(data) die de uiteindelijk verwerkte DataFrame retourneert.
  5. Wijs de verwerkte dataset toe aan een variabele genaamd processed_data.

Print de eerste 5 rijen van de uiteindelijke DataFrame.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 4
single

single

some-alt