Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Forhåndsbehandlingspipeline | Funksjonsutvikling for Maskinlæring
Dataprosessering og Feature Engineering

bookUtfordring: Forhåndsbehandlingspipeline

Oppgave

Swipe to start coding

Du får utdelt Titanic-datasettet fra seaborn-biblioteket. Din oppgave er å bygge en fullstendig preprosesseringspipeline som utfører alle nødvendige datatransformasjoner før maskinlæring.

Følg disse stegene:

  1. Last inn datasettet med sns.load_dataset("titanic").
  2. Håndter manglende verdier:
  • Numeriske kolonner → fyll med gjennomsnitt.
  • Kategoriske kolonner → fyll med modus.
  1. Kode de kategoriske variablene sex og embarked ved å bruke pd.get_dummies().
  2. Skaler de numeriske kolonnene age og fare med StandardScaler.
  3. Lag en ny variabel family_size = sibsp + parch + 1.
  4. Kombiner alle transformasjoner i en funksjon kalt preprocess_titanic(data) som returnerer den ferdig prosesserte DataFrame.
  5. Tildel det prosesserte datasettet til en variabel kalt processed_data.

Skriv ut de første 5 radene av den endelige DataFrame.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain that in simpler terms?

What are the main benefits of this approach?

Are there any common mistakes to avoid with this?

close

Awesome!

Completion rate improved to 8.33

bookUtfordring: Forhåndsbehandlingspipeline

Sveip for å vise menyen

Oppgave

Swipe to start coding

Du får utdelt Titanic-datasettet fra seaborn-biblioteket. Din oppgave er å bygge en fullstendig preprosesseringspipeline som utfører alle nødvendige datatransformasjoner før maskinlæring.

Følg disse stegene:

  1. Last inn datasettet med sns.load_dataset("titanic").
  2. Håndter manglende verdier:
  • Numeriske kolonner → fyll med gjennomsnitt.
  • Kategoriske kolonner → fyll med modus.
  1. Kode de kategoriske variablene sex og embarked ved å bruke pd.get_dummies().
  2. Skaler de numeriske kolonnene age og fare med StandardScaler.
  3. Lag en ny variabel family_size = sibsp + parch + 1.
  4. Kombiner alle transformasjoner i en funksjon kalt preprocess_titanic(data) som returnerer den ferdig prosesserte DataFrame.
  5. Tildel det prosesserte datasettet til en variabel kalt processed_data.

Skriv ut de første 5 radene av den endelige DataFrame.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
single

single

some-alt