Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Implémentation d'un Arbre de Décision | Arbre de Décision
Classification avec Python

bookDéfi : Implémentation d'un Arbre de Décision

Dans ce défi, vous utiliserez le jeu de données Titanic, qui contient des informations sur les passagers du Titanic, notamment leur âge, leur sexe, la taille de leur famille, et plus encore. L'objectif est de prédire si un passager a survécu ou non.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

Pour implémenter l'Arbre de Décision, vous pouvez utiliser le DecisionTreeClassifier de sklearn :

Votre tâche consiste à construire un arbre de décision et à déterminer les meilleures valeurs de max_depth et min_samples_leaf à l'aide d'une recherche par grille.

Tâche

Swipe to start coding

Vous disposez d'un jeu de données Titanic stocké sous forme de DataFrame dans la variable df.

  • Initialiser un modèle d'Arbre de Décision et le stocker dans la variable decision_tree.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [1, 2, 3, 4, 5, 6, 7] pour max_depth et [1, 2, 4, 6] pour min_samples_leaf, et le stocker dans la variable param_grid.
  • Initialiser et entraîner un objet GridSearchCV, définir le nombre de plis à 10, et stocker le modèle entraîné dans la variable grid_cv.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

How do I build a Decision Tree with this dataset?

Can you explain how to use grid search to find the best parameters?

What do max_depth and min_samples_leaf mean in a Decision Tree?

close

Awesome!

Completion rate improved to 4.17

bookDéfi : Implémentation d'un Arbre de Décision

Glissez pour afficher le menu

Dans ce défi, vous utiliserez le jeu de données Titanic, qui contient des informations sur les passagers du Titanic, notamment leur âge, leur sexe, la taille de leur famille, et plus encore. L'objectif est de prédire si un passager a survécu ou non.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

Pour implémenter l'Arbre de Décision, vous pouvez utiliser le DecisionTreeClassifier de sklearn :

Votre tâche consiste à construire un arbre de décision et à déterminer les meilleures valeurs de max_depth et min_samples_leaf à l'aide d'une recherche par grille.

Tâche

Swipe to start coding

Vous disposez d'un jeu de données Titanic stocké sous forme de DataFrame dans la variable df.

  • Initialiser un modèle d'Arbre de Décision et le stocker dans la variable decision_tree.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [1, 2, 3, 4, 5, 6, 7] pour max_depth et [1, 2, 4, 6] pour min_samples_leaf, et le stocker dans la variable param_grid.
  • Initialiser et entraîner un objet GridSearchCV, définir le nombre de plis à 10, et stocker le modèle entraîné dans la variable grid_cv.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

some-alt