Défi : Implémentation d'un Arbre de Décision
Dans ce défi, vous utiliserez le jeu de données Titanic, qui contient des informations sur les passagers du Titanic, notamment leur âge, leur sexe, la taille de leur famille, et plus encore. L'objectif est de prédire si un passager a survécu ou non.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Pour implémenter l'Arbre de Décision, vous pouvez utiliser le DecisionTreeClassifier de sklearn :
Votre tâche consiste à construire un arbre de décision et à déterminer les meilleures valeurs de max_depth et min_samples_leaf à l'aide d'une recherche par grille.
Swipe to start coding
Vous disposez d'un jeu de données Titanic stocké sous forme de DataFrame dans la variable df.
- Initialiser un modèle d'Arbre de Décision et le stocker dans la variable
decision_tree. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[1, 2, 3, 4, 5, 6, 7]pourmax_depthet[1, 2, 4, 6]pourmin_samples_leaf, et le stocker dans la variableparam_grid. - Initialiser et entraîner un objet
GridSearchCV, définir le nombre de plis à10, et stocker le modèle entraîné dans la variablegrid_cv.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Défi : Implémentation d'un Arbre de Décision
Glissez pour afficher le menu
Dans ce défi, vous utiliserez le jeu de données Titanic, qui contient des informations sur les passagers du Titanic, notamment leur âge, leur sexe, la taille de leur famille, et plus encore. L'objectif est de prédire si un passager a survécu ou non.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Pour implémenter l'Arbre de Décision, vous pouvez utiliser le DecisionTreeClassifier de sklearn :
Votre tâche consiste à construire un arbre de décision et à déterminer les meilleures valeurs de max_depth et min_samples_leaf à l'aide d'une recherche par grille.
Swipe to start coding
Vous disposez d'un jeu de données Titanic stocké sous forme de DataFrame dans la variable df.
- Initialiser un modèle d'Arbre de Décision et le stocker dans la variable
decision_tree. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[1, 2, 3, 4, 5, 6, 7]pourmax_depthet[1, 2, 4, 6]pourmin_samples_leaf, et le stocker dans la variableparam_grid. - Initialiser et entraîner un objet
GridSearchCV, définir le nombre de plis à10, et stocker le modèle entraîné dans la variablegrid_cv.
Solution
Merci pour vos commentaires !
single