Uitdaging: Implementatie van een Beslissingsboom
In deze uitdaging maak je gebruik van de Titanic dataset, die informatie bevat over passagiers op de Titanic, waaronder hun leeftijd, geslacht, gezinsgrootte en meer. Het doel is om te voorspellen of een passagier de ramp heeft overleefd of niet.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Voor het implementeren van de Decision Tree kun je de DecisionTreeClassifier uit sklearn gebruiken:
Uw taak is om een Decision Tree te bouwen en de optimale max_depth en min_samples_leaf te vinden met behulp van grid search.
Swipe to start coding
Je krijgt een Titanic-dataset aangeboden die is opgeslagen als een DataFrame in de variabele df.
- Initialiseer een Decision Tree-model en sla dit op in de variabele
decision_tree. - Maak een woordenboek voor
GridSearchCVom te itereren door de waarden[1, 2, 3, 4, 5, 6, 7]voormax_depthen[1, 2, 4, 6]voormin_samples_leaf, en sla dit op in de variabeleparam_grid. - Initialiseer en train een
GridSearchCV-object, stel het aantal folds in op10, en sla het getrainde model op in de variabelegrid_cv.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Uitdaging: Implementatie van een Beslissingsboom
Veeg om het menu te tonen
In deze uitdaging maak je gebruik van de Titanic dataset, die informatie bevat over passagiers op de Titanic, waaronder hun leeftijd, geslacht, gezinsgrootte en meer. Het doel is om te voorspellen of een passagier de ramp heeft overleefd of niet.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Voor het implementeren van de Decision Tree kun je de DecisionTreeClassifier uit sklearn gebruiken:
Uw taak is om een Decision Tree te bouwen en de optimale max_depth en min_samples_leaf te vinden met behulp van grid search.
Swipe to start coding
Je krijgt een Titanic-dataset aangeboden die is opgeslagen als een DataFrame in de variabele df.
- Initialiseer een Decision Tree-model en sla dit op in de variabele
decision_tree. - Maak een woordenboek voor
GridSearchCVom te itereren door de waarden[1, 2, 3, 4, 5, 6, 7]voormax_depthen[1, 2, 4, 6]voormin_samples_leaf, en sla dit op in de variabeleparam_grid. - Initialiseer en train een
GridSearchCV-object, stel het aantal folds in op10, en sla het getrainde model op in de variabelegrid_cv.
Oplossing
Bedankt voor je feedback!
single