Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Esikäsittelyputki | Piirteiden Suunnittelu Koneoppimista Varten
Datan Esikäsittely ja Ominaisuuksien Rakentaminen

bookHaaste: Esikäsittelyputki

Tehtävä

Swipe to start coding

Sinulle annetaan Titanic-aineisto seaborn-kirjastosta. Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.

Noudata seuraavia vaiheita:

  1. Lataa aineisto komennolla sns.load_dataset("titanic").
  2. Käsittele puuttuvat arvot:
  • Numeeriset sarakkeet → täytä keskiarvolla.
  • Kategoriset sarakkeet → täytä moodilla.
  1. Koodaa kategoriset muuttujat sex ja embarked käyttäen pd.get_dummies().
  2. Skaalaa numeeriset sarakkeet age ja fare käyttäen StandardScaler.
  3. Luo uusi ominaisuus family_size = sibsp + parch + 1.
  4. Yhdistä kaikki muunnokset funktioon nimeltä preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion.
  5. Aseta käsitelty aineisto muuttujaan nimeltä processed_data.

Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain that in simpler terms?

What are the main benefits of this approach?

Are there any common mistakes to avoid with this?

close

Awesome!

Completion rate improved to 8.33

bookHaaste: Esikäsittelyputki

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle annetaan Titanic-aineisto seaborn-kirjastosta. Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.

Noudata seuraavia vaiheita:

  1. Lataa aineisto komennolla sns.load_dataset("titanic").
  2. Käsittele puuttuvat arvot:
  • Numeeriset sarakkeet → täytä keskiarvolla.
  • Kategoriset sarakkeet → täytä moodilla.
  1. Koodaa kategoriset muuttujat sex ja embarked käyttäen pd.get_dummies().
  2. Skaalaa numeeriset sarakkeet age ja fare käyttäen StandardScaler.
  3. Luo uusi ominaisuus family_size = sibsp + parch + 1.
  4. Yhdistä kaikki muunnokset funktioon nimeltä preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion.
  5. Aseta käsitelty aineisto muuttujaan nimeltä processed_data.

Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4
single

single

some-alt