Défi : Comparaison de Modèles
Vous allez maintenant comparer les modèles étudiés à l'aide d'un seul jeu de données — le jeu de données sur le cancer du sein. La variable cible est la colonne 'diagnosis', où 1 représente les cas malins et 0 les cas bénins.
Vous appliquerez GridSearchCV à chaque modèle pour trouver les meilleurs paramètres. Dans cette tâche, vous utiliserez le rappel comme métrique d'évaluation car il est crucial de minimiser les faux négatifs. Pour que GridSearchCV sélectionne les meilleurs paramètres en fonction du rappel, définissez scoring='recall'.
Swipe to start coding
Un jeu de données sur le cancer du sein est fourni sous forme de DataFrame dans la variable df.
- Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[3, 5, 7, 12]pourn_neighborset le stocker dans la variableknn_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[0.1, 1, 10]pourCet le stocker dans la variablelr_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[2, 4, 6, 10]pourmax_depthet[1, 2, 4, 7]pourmin_samples_leaf, et le stocker dans la variabledt_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[2, 4, 6]pourmax_depthet[20, 50, 100]pourn_estimators, et le stocker dans la variablerf_params. - Initialiser et entraîner un objet
GridSearchCVpour chacun des modèles, et stocker les modèles entraînés dans les variables respectives :knn_grid,lr_grid,dt_gridetrf_grid.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4.17
Défi : Comparaison de Modèles
Glissez pour afficher le menu
Vous allez maintenant comparer les modèles étudiés à l'aide d'un seul jeu de données — le jeu de données sur le cancer du sein. La variable cible est la colonne 'diagnosis', où 1 représente les cas malins et 0 les cas bénins.
Vous appliquerez GridSearchCV à chaque modèle pour trouver les meilleurs paramètres. Dans cette tâche, vous utiliserez le rappel comme métrique d'évaluation car il est crucial de minimiser les faux négatifs. Pour que GridSearchCV sélectionne les meilleurs paramètres en fonction du rappel, définissez scoring='recall'.
Swipe to start coding
Un jeu de données sur le cancer du sein est fourni sous forme de DataFrame dans la variable df.
- Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[3, 5, 7, 12]pourn_neighborset le stocker dans la variableknn_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[0.1, 1, 10]pourCet le stocker dans la variablelr_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[2, 4, 6, 10]pourmax_depthet[1, 2, 4, 7]pourmin_samples_leaf, et le stocker dans la variabledt_params. - Créer un dictionnaire pour
GridSearchCVafin d'itérer sur les valeurs[2, 4, 6]pourmax_depthet[20, 50, 100]pourn_estimators, et le stocker dans la variablerf_params. - Initialiser et entraîner un objet
GridSearchCVpour chacun des modèles, et stocker les modèles entraînés dans les variables respectives :knn_grid,lr_grid,dt_gridetrf_grid.
Solution
Merci pour vos commentaires !
single