Haaste: Esikäsittelyputki
Swipe to start coding
Sinulle annetaan Titanic-aineisto seaborn-kirjastosta.
Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.
Noudata seuraavia vaiheita:
- Lataa aineisto komennolla
sns.load_dataset("titanic"). - Käsittele puuttuvat arvot:
- Numeeriset sarakkeet → täytä keskiarvolla.
- Kategoriset sarakkeet → täytä moodilla.
- Koodaa kategoriset muuttujat
sexjaembarkedkäyttäenpd.get_dummies(). - Skaalaa numeeriset sarakkeet
agejafarekäyttäenStandardScaler. - Luo uusi ominaisuus
family_size = sibsp + parch + 1. - Yhdistä kaikki muunnokset funktioon nimeltä
preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion. - Aseta käsitelty aineisto muuttujaan nimeltä
processed_data.
Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain that in simpler terms?
What are the main benefits of this approach?
Are there any common mistakes to avoid with this?
Awesome!
Completion rate improved to 8.33
Haaste: Esikäsittelyputki
Pyyhkäise näyttääksesi valikon
Swipe to start coding
Sinulle annetaan Titanic-aineisto seaborn-kirjastosta.
Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.
Noudata seuraavia vaiheita:
- Lataa aineisto komennolla
sns.load_dataset("titanic"). - Käsittele puuttuvat arvot:
- Numeeriset sarakkeet → täytä keskiarvolla.
- Kategoriset sarakkeet → täytä moodilla.
- Koodaa kategoriset muuttujat
sexjaembarkedkäyttäenpd.get_dummies(). - Skaalaa numeeriset sarakkeet
agejafarekäyttäenStandardScaler. - Luo uusi ominaisuus
family_size = sibsp + parch + 1. - Yhdistä kaikki muunnokset funktioon nimeltä
preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion. - Aseta käsitelty aineisto muuttujaan nimeltä
processed_data.
Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.
Ratkaisu
Kiitos palautteestasi!
single