Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Implementering af en Random Forest | Random Forest
Klassifikation med Python

bookUdfordring: Implementering af en Random Forest

I sklearn implementeres klassifikationsversionen af Random Forest ved hjælp af RandomForestClassifier:

Du vil også beregne krydsvalideringsnøjagtigheden ved hjælp af funktionen cross_val_score():

Til sidst udskrives vigtigheden af hver feature. Attributten feature_importances_ returnerer et array med vigtighedsscorer – disse scorer repræsenterer, hvor meget hver feature har bidraget til at reducere Gini-impuritet på tværs af alle beslutningsnoder, hvor denne feature blev brugt. Med andre ord, jo mere en feature hjælper med at opdele dataene på en nyttig måde, desto højere er dens vigtighed.

Dog giver attributten kun scorerne uden featurenavne. For at vise begge kan du parre dem ved hjælp af Pythons zip()-funktion:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Dette udskriver hvert featurenavn sammen med dets vigtighedsscore, hvilket gør det lettere at forstå, hvilke features modellen har lagt mest vægt på.

Opgave

Swipe to start coding

Du har fået et Titanic-datasæt, som er gemt som en DataFrame i variablen df.

  • Initialiser Random Forest-modellen, sæt random_state=42, træn den, og gem den trænede model i variablen random_forest.
  • Beregn krydsvalideringsscorerne for den trænede model ved brug af 10 fold, og gem de resulterende scorer i variablen cv_scores.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 3
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 4.17

bookUdfordring: Implementering af en Random Forest

Stryg for at vise menuen

I sklearn implementeres klassifikationsversionen af Random Forest ved hjælp af RandomForestClassifier:

Du vil også beregne krydsvalideringsnøjagtigheden ved hjælp af funktionen cross_val_score():

Til sidst udskrives vigtigheden af hver feature. Attributten feature_importances_ returnerer et array med vigtighedsscorer – disse scorer repræsenterer, hvor meget hver feature har bidraget til at reducere Gini-impuritet på tværs af alle beslutningsnoder, hvor denne feature blev brugt. Med andre ord, jo mere en feature hjælper med at opdele dataene på en nyttig måde, desto højere er dens vigtighed.

Dog giver attributten kun scorerne uden featurenavne. For at vise begge kan du parre dem ved hjælp af Pythons zip()-funktion:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Dette udskriver hvert featurenavn sammen med dets vigtighedsscore, hvilket gør det lettere at forstå, hvilke features modellen har lagt mest vægt på.

Opgave

Swipe to start coding

Du har fået et Titanic-datasæt, som er gemt som en DataFrame i variablen df.

  • Initialiser Random Forest-modellen, sæt random_state=42, træn den, og gem den trænede model i variablen random_forest.
  • Beregn krydsvalideringsscorerne for den trænede model ved brug af 10 fold, og gem de resulterende scorer i variablen cv_scores.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 3
single

single

some-alt