single
Utfordring: Implementering av en Random Forest
Sveip for å vise menyen
I sklearn er klassifikasjonsversjonen av Random Forest implementert med RandomForestClassifier:
Du skal også beregne kryssvalideringsnøyaktigheten ved å bruke funksjonen cross_val_score():
Til slutt vil du skrive ut viktigheten til hver funksjon. Attributtet feature_importances_ returnerer et array med viktighetspoeng – disse poengene viser hvor mye hver funksjon bidro til å redusere Gini-impuritet på tvers av alle beslutningsnoder der funksjonen ble brukt. Med andre ord, jo mer en funksjon bidrar til å splitte dataene på en nyttig måte, desto høyere er dens viktighet.
Attributtet gir imidlertid kun poeng uten funksjonsnavn. For å vise begge deler, kan du pare dem ved å bruke Pythons zip()-funksjon:
for feature, importance in zip(X.columns, model.feature_importances_):
print(feature, importance)
Dette skriver ut hvert funksjonsnavn sammen med dets viktighetspoeng, noe som gjør det enklere å forstå hvilke funksjoner modellen stolte mest på.
Sveip for å begynne å kode
Du har fått utdelt Titanic-datasettet lagret som en DataFrame i variabelen df.
- Initialiser Random Forest-modellen, sett
random_state=42, tren den, og lagre den tilpassede modellen i variabelenrandom_forest. - Beregn kryssvalideringsskårene for den trente modellen ved å bruke
10fold, og lagre de resulterende skårene i variabelencv_scores.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår