Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Datarensning | Grundlæggende Datarensning
Datapræprocessering og Feature Engineering

bookUdfordring: Datarensning

Opgave

Swipe to start coding

Du får stillet Titanic-datasættet til rådighed, indlæst via Seaborn-biblioteket. Din opgave er at rense datasættet ved hjælp af pandas ved at udføre følgende trin:

  1. Indlæs datasættet med sns.load_dataset("titanic").
  2. Erstat manglende værdier i kolonnen age med kolonnens gennemsnit.
  3. Erstat manglende værdier i kolonnen embarked med den hyppigste værdi (mode).
  4. Fjern duplikerede rækker.
  5. Fjern outliers i kolonnen fare ved hjælp af IQR-metoden.

Returnér det endelige rensede datasæt som en DataFrame med navnet cleaned_data.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 8.33

bookUdfordring: Datarensning

Stryg for at vise menuen

Opgave

Swipe to start coding

Du får stillet Titanic-datasættet til rådighed, indlæst via Seaborn-biblioteket. Din opgave er at rense datasættet ved hjælp af pandas ved at udføre følgende trin:

  1. Indlæs datasættet med sns.load_dataset("titanic").
  2. Erstat manglende værdier i kolonnen age med kolonnens gennemsnit.
  3. Erstat manglende værdier i kolonnen embarked med den hyppigste værdi (mode).
  4. Fjern duplikerede rækker.
  5. Fjern outliers i kolonnen fare ved hjælp af IQR-metoden.

Returnér det endelige rensede datasæt som en DataFrame med navnet cleaned_data.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 4
single

single

some-alt