Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Tout Rassembler | Modélisation
Introduction au ML Avec Scikit-Learn

bookDéfi : Tout Rassembler

Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement, jusqu'à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

  1. Encoder la cible.
  2. Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
  3. Créer un ColumnTransformer pour encoder uniquement les colonnes 'island' et 'sex'. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales.
  4. Compléter les valeurs manquantes dans un param_grid pour tester les valeurs suivantes pour le nombre de voisins : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec le KNeighborsClassifier comme modèle.
  6. Construire un pipeline qui commence par ct comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine par GridSearchCV comme estimateur final.
  7. Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
  8. Évaluer le modèle sur l'ensemble de test. (Afficher son score)
  9. Obtenir une prédiction de la cible pour X_test.
  10. Afficher le meilleur estimateur trouvé par grid_search.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 10
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you provide the dataset we'll be working with?

What type of model should I use for this challenge?

Could you outline the specific steps involved in the workflow?

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Tout Rassembler

Glissez pour afficher le menu

Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement, jusqu'à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

  1. Encoder la cible.
  2. Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
  3. Créer un ColumnTransformer pour encoder uniquement les colonnes 'island' et 'sex'. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales.
  4. Compléter les valeurs manquantes dans un param_grid pour tester les valeurs suivantes pour le nombre de voisins : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec le KNeighborsClassifier comme modèle.
  6. Construire un pipeline qui commence par ct comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine par GridSearchCV comme estimateur final.
  7. Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
  8. Évaluer le modèle sur l'ensemble de test. (Afficher son score)
  9. Obtenir une prédiction de la cible pour X_test.
  10. Afficher le meilleur estimateur trouvé par grid_search.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

close

Awesome!

Completion rate improved to 3.13
Section 4. Chapitre 10
single

single

some-alt