Apprendre Défi : Comparaison de Modèles

Vous allez maintenant comparer les modèles étudiés à l'aide d'un seul jeu de données — le jeu de données sur le cancer du sein. La variable cible est la colonne 'diagnosis', où 1 représente les cas malins et 0 les cas bénins.

Vous appliquerez GridSearchCV à chaque modèle pour trouver les meilleurs paramètres. Dans cette tâche, vous utiliserez le rappel comme métrique d'évaluation car il est crucial de minimiser les faux négatifs. Pour que GridSearchCV sélectionne les meilleurs paramètres en fonction du rappel, définissez scoring='recall'.

Tâche

Swipe to start coding

Un jeu de données sur le cancer du sein est fourni sous forme de DataFrame dans la variable df.

Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [3, 5, 7, 12] pour n_neighbors et le stocker dans la variable knn_params.
Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [0.1, 1, 10] pour C et le stocker dans la variable lr_params.
Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6, 10] pour max_depth et [1, 2, 4, 7] pour min_samples_leaf, et le stocker dans la variable dt_params.
Créer un dictionnaire pour GridSearchCV afin d'itérer sur les valeurs [2, 4, 6] pour max_depth et [20, 50, 100] pour n_estimators, et le stocker dans la variable rf_params.
Initialiser et entraîner un objet GridSearchCV pour chacun des modèles, et stocker les modèles entraînés dans les variables respectives : knn_grid, lr_grid, dt_grid et rf_grid.

Solution

Tout était clair ?

Merci pour vos commentaires !

Section 5. Chapitre 3

single

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you show me how to set up GridSearchCV with recall as the scoring metric?

Which models should I compare using GridSearchCV?

Can you explain why recall is important in this context?

Glissez pour afficher le menu