Udfordring: Implementering af et Beslutningstræ
I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:
Din opgave er at opbygge et Decision Tree og finde den bedste max_depth og min_samples_leaf ved hjælp af grid search.
Swipe to start coding
Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.
- Initialiser en Decision Tree-model og gem den i variablen
decision_tree. - Opret en ordbog til
GridSearchCVfor at iterere gennem værdierne[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og gem den i variablenparam_grid. - Initialiser og træn et
GridSearchCV-objekt, sæt antallet af fold til10, og gem den trænede model i variablengrid_cv.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 4.17
Udfordring: Implementering af et Beslutningstræ
Stryg for at vise menuen
I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:
Din opgave er at opbygge et Decision Tree og finde den bedste max_depth og min_samples_leaf ved hjælp af grid search.
Swipe to start coding
Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.
- Initialiser en Decision Tree-model og gem den i variablen
decision_tree. - Opret en ordbog til
GridSearchCVfor at iterere gennem værdierne[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og gem den i variablenparam_grid. - Initialiser og træn et
GridSearchCV-objekt, sæt antallet af fold til10, og gem den trænede model i variablengrid_cv.
Løsning
Tak for dine kommentarer!
single