Défi : Tout Rassembler
Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement, jusqu'à l'évaluation du modèle.





Swipe to start coding
- Encoder la cible.
- Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
- Créer un
ColumnTransformer
pour encoder uniquement les colonnes'island'
et'sex'
. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales. - Compléter les valeurs manquantes dans un
param_grid
pour tester les valeurs suivantes pour le nombre de voisins :[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Créer un objet
GridSearchCV
avec leKNeighborsClassifier
comme modèle. - Construire un pipeline qui commence par
ct
comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine parGridSearchCV
comme estimateur final. - Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
- Évaluer le modèle sur l'ensemble de test. (Afficher son score)
- Obtenir une prédiction de la cible pour
X_test
. - Afficher le meilleur estimateur trouvé par
grid_search
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you provide the dataset we'll be working with?
What type of model should I use for this challenge?
Could you outline the specific steps involved in the workflow?
Awesome!
Completion rate improved to 3.13
Défi : Tout Rassembler
Glissez pour afficher le menu
Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement, jusqu'à l'évaluation du modèle.





Swipe to start coding
- Encoder la cible.
- Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
- Créer un
ColumnTransformer
pour encoder uniquement les colonnes'island'
et'sex'
. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales. - Compléter les valeurs manquantes dans un
param_grid
pour tester les valeurs suivantes pour le nombre de voisins :[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Créer un objet
GridSearchCV
avec leKNeighborsClassifier
comme modèle. - Construire un pipeline qui commence par
ct
comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine parGridSearchCV
comme estimateur final. - Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
- Évaluer le modèle sur l'ensemble de test. (Afficher son score)
- Obtenir une prédiction de la cible pour
X_test
. - Afficher le meilleur estimateur trouvé par
grid_search
.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.13single