Udfordring: Forbehandlingspipeline
Swipe to start coding
Du får stillet Titanic-datasættet fra seaborn-biblioteket til rådighed.
Din opgave er at opbygge en fuldstændig forbehandlingspipeline, der udfører alle nødvendige datatransformationer før maskinlæring.
Følg disse trin:
- Indlæs datasættet med
sns.load_dataset("titanic"). - Håndter manglende værdier:
- Numeriske kolonner → udfyld med middelværdi.
- Kategoriske kolonner → udfyld med typetal.
- Kod de kategoriske variable
sexogembarkedved hjælp afpd.get_dummies(). - Skaler de numeriske kolonner
ageogfaremedStandardScaler. - Opret en ny feature
family_size = sibsp + parch + 1. - Kombinér alle transformationer i en funktion kaldet
preprocess_titanic(data), som returnerer det endeligt behandlede DataFrame. - Tildel det behandlede datasæt til en variabel kaldet
processed_data.
Udskriv de første 5 rækker af det endelige DataFrame.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 8.33
Udfordring: Forbehandlingspipeline
Stryg for at vise menuen
Swipe to start coding
Du får stillet Titanic-datasættet fra seaborn-biblioteket til rådighed.
Din opgave er at opbygge en fuldstændig forbehandlingspipeline, der udfører alle nødvendige datatransformationer før maskinlæring.
Følg disse trin:
- Indlæs datasættet med
sns.load_dataset("titanic"). - Håndter manglende værdier:
- Numeriske kolonner → udfyld med middelværdi.
- Kategoriske kolonner → udfyld med typetal.
- Kod de kategoriske variable
sexogembarkedved hjælp afpd.get_dummies(). - Skaler de numeriske kolonner
ageogfaremedStandardScaler. - Opret en ny feature
family_size = sibsp + parch + 1. - Kombinér alle transformationer i en funktion kaldet
preprocess_titanic(data), som returnerer det endeligt behandlede DataFrame. - Tildel det behandlede datasæt til en variabel kaldet
processed_data.
Udskriv de første 5 rækker af det endelige DataFrame.
Løsning
Tak for dine kommentarer!
single