Haaste: Satunnaismetsän Toteuttaminen
sklearn-kirjastossa satunnaismetsän luokitusversio toteutetaan RandomForestClassifier-luokalla:
Lasket myös ristiinvalidoinnin tarkkuuden käyttämällä cross_val_score()-funktiota:
Lopuksi tulostat kunkin piirteen tärkeyden. feature_importances_-attribuutti palauttaa taulukon tärkeyspisteitä – nämä pisteet kuvaavat, kuinka paljon kukin piirre vaikutti Gini-epäpuhtauden vähentämiseen kaikissa päätössolmuissa, joissa kyseistä piirrettä käytettiin. Toisin sanoen, mitä enemmän piirre auttaa jakamaan dataa hyödyllisellä tavalla, sitä suurempi on sen tärkeys.
Attribuutti antaa kuitenkin vain pisteet ilman piirteen nimiä. Molempien näyttämiseksi voit yhdistää ne Pythonin zip()-funktiolla:
for feature, importance in zip(X.columns, model.feature_importances_):
print(feature, importance)
Tämä tulostaa kunkin piirteen nimen ja sen tärkeyspisteen, mikä helpottaa ymmärtämään, mihin piirteisiin malli tukeutui eniten.
Swipe to start coding
Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muuttujaan df.
- Alusta Random Forest -malli, aseta
random_state=42, kouluta se ja tallenna sovitettu malli muuttujaanrandom_forest. - Laske koulutetun mallin ristiinvalidointipisteet käyttäen
10-kertaista ristiinvalidointia ja tallenna tulokset muuttujaancv_scores.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4.17
Haaste: Satunnaismetsän Toteuttaminen
Pyyhkäise näyttääksesi valikon
sklearn-kirjastossa satunnaismetsän luokitusversio toteutetaan RandomForestClassifier-luokalla:
Lasket myös ristiinvalidoinnin tarkkuuden käyttämällä cross_val_score()-funktiota:
Lopuksi tulostat kunkin piirteen tärkeyden. feature_importances_-attribuutti palauttaa taulukon tärkeyspisteitä – nämä pisteet kuvaavat, kuinka paljon kukin piirre vaikutti Gini-epäpuhtauden vähentämiseen kaikissa päätössolmuissa, joissa kyseistä piirrettä käytettiin. Toisin sanoen, mitä enemmän piirre auttaa jakamaan dataa hyödyllisellä tavalla, sitä suurempi on sen tärkeys.
Attribuutti antaa kuitenkin vain pisteet ilman piirteen nimiä. Molempien näyttämiseksi voit yhdistää ne Pythonin zip()-funktiolla:
for feature, importance in zip(X.columns, model.feature_importances_):
print(feature, importance)
Tämä tulostaa kunkin piirteen nimen ja sen tärkeyspisteen, mikä helpottaa ymmärtämään, mihin piirteisiin malli tukeutui eniten.
Swipe to start coding
Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muuttujaan df.
- Alusta Random Forest -malli, aseta
random_state=42, kouluta se ja tallenna sovitettu malli muuttujaanrandom_forest. - Laske koulutetun mallin ristiinvalidointipisteet käyttäen
10-kertaista ristiinvalidointia ja tallenna tulokset muuttujaancv_scores.
Ratkaisu
Kiitos palautteestasi!
single