Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Comparaison de Modèles | Comparaison des Modèles
Classification avec Python

bookDéfi : Comparaison de Modèles

Vous allez maintenant comparer les modèles étudiés à l'aide d'un seul jeu de données — le jeu de données sur le cancer du sein. La variable cible est la colonne 'diagnosis', où 1 représente les cas malins et 0 les cas bénins.

Vous appliquerez GridSearchCV à chaque modèle pour trouver les meilleurs paramètres. Dans cette tâche, vous utiliserez le rappel comme métrique d'évaluation car il est crucial de minimiser les faux négatifs. Pour que GridSearchCV sélectionne les meilleurs paramètres en fonction du rappel, définissez scoring='recall'.

Tâche

Swipe to start coding

Un jeu de données sur le cancer du sein est fourni sous forme de DataFrame dans la variable df.

  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [3, 5, 7, 12] pour n_neighbors et le stocker dans la variable knn_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [0.1, 1, 10] pour C et le stocker dans la variable lr_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6, 10] pour max_depth et [1, 2, 4, 7] pour min_samples_leaf, et le stocker dans la variable dt_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6] pour max_depth et [20, 50, 100] pour n_estimators, et le stocker dans la variable rf_params.
  • Initialiser et entraîner un objet GridSearchCV pour chacun des modèles, et stocker les modèles entraînés dans les variables respectives : knn_grid, lr_grid, dt_grid et rf_grid.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 4.17

bookDéfi : Comparaison de Modèles

Glissez pour afficher le menu

Vous allez maintenant comparer les modèles étudiés à l'aide d'un seul jeu de données — le jeu de données sur le cancer du sein. La variable cible est la colonne 'diagnosis', où 1 représente les cas malins et 0 les cas bénins.

Vous appliquerez GridSearchCV à chaque modèle pour trouver les meilleurs paramètres. Dans cette tâche, vous utiliserez le rappel comme métrique d'évaluation car il est crucial de minimiser les faux négatifs. Pour que GridSearchCV sélectionne les meilleurs paramètres en fonction du rappel, définissez scoring='recall'.

Tâche

Swipe to start coding

Un jeu de données sur le cancer du sein est fourni sous forme de DataFrame dans la variable df.

  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [3, 5, 7, 12] pour n_neighbors et le stocker dans la variable knn_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [0.1, 1, 10] pour C et le stocker dans la variable lr_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6, 10] pour max_depth et [1, 2, 4, 7] pour min_samples_leaf, et le stocker dans la variable dt_params.
  • Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6] pour max_depth et [20, 50, 100] pour n_estimators, et le stocker dans la variable rf_params.
  • Initialiser et entraîner un objet GridSearchCV pour chacun des modèles, et stocker les modèles entraînés dans les variables respectives : knn_grid, lr_grid, dt_grid et rf_grid.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
single

single

some-alt