Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Satunnaismetsän Toteuttaminen | Satunnaismetsä
Luokittelu Pythonilla

bookHaaste: Satunnaismetsän Toteuttaminen

sklearn-kirjastossa satunnaismetsän luokitusversio toteutetaan RandomForestClassifier-luokalla:

Lasket myös ristiinvalidoinnin tarkkuuden käyttämällä cross_val_score()-funktiota:

Lopuksi tulostat kunkin piirteen tärkeyden. feature_importances_-attribuutti palauttaa taulukon tärkeyspisteitä – nämä pisteet kuvaavat, kuinka paljon kukin piirre vaikutti Gini-epäpuhtauden vähentämiseen kaikissa päätössolmuissa, joissa kyseistä piirrettä käytettiin. Toisin sanoen, mitä enemmän piirre auttaa jakamaan dataa hyödyllisellä tavalla, sitä suurempi on sen tärkeys.

Attribuutti antaa kuitenkin vain pisteet ilman piirteen nimiä. Molempien näyttämiseksi voit yhdistää ne Pythonin zip()-funktiolla:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Tämä tulostaa kunkin piirteen nimen ja sen tärkeyspisteen, mikä helpottaa ymmärtämään, mihin piirteisiin malli tukeutui eniten.

Tehtävä

Swipe to start coding

Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muuttujaan df.

  • Alusta Random Forest -malli, aseta random_state=42, kouluta se ja tallenna sovitettu malli muuttujaan random_forest.
  • Laske koulutetun mallin ristiinvalidointipisteet käyttäen 10-kertaista ristiinvalidointia ja tallenna tulokset muuttujaan cv_scores.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 3
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 4.17

bookHaaste: Satunnaismetsän Toteuttaminen

Pyyhkäise näyttääksesi valikon

sklearn-kirjastossa satunnaismetsän luokitusversio toteutetaan RandomForestClassifier-luokalla:

Lasket myös ristiinvalidoinnin tarkkuuden käyttämällä cross_val_score()-funktiota:

Lopuksi tulostat kunkin piirteen tärkeyden. feature_importances_-attribuutti palauttaa taulukon tärkeyspisteitä – nämä pisteet kuvaavat, kuinka paljon kukin piirre vaikutti Gini-epäpuhtauden vähentämiseen kaikissa päätössolmuissa, joissa kyseistä piirrettä käytettiin. Toisin sanoen, mitä enemmän piirre auttaa jakamaan dataa hyödyllisellä tavalla, sitä suurempi on sen tärkeys.

Attribuutti antaa kuitenkin vain pisteet ilman piirteen nimiä. Molempien näyttämiseksi voit yhdistää ne Pythonin zip()-funktiolla:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Tämä tulostaa kunkin piirteen nimen ja sen tärkeyspisteen, mikä helpottaa ymmärtämään, mihin piirteisiin malli tukeutui eniten.

Tehtävä

Swipe to start coding

Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muuttujaan df.

  • Alusta Random Forest -malli, aseta random_state=42, kouluta se ja tallenna sovitettu malli muuttujaan random_forest.
  • Laske koulutetun mallin ristiinvalidointipisteet käyttäen 10-kertaista ristiinvalidointia ja tallenna tulokset muuttujaan cv_scores.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 3
single

single

some-alt