Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Création d'un Pipeline | Pipelines
Introduction au ML Avec Scikit-Learn

bookDéfi : Création d'un Pipeline

Dans ce défi, regroupez toutes les étapes de prétraitement dans un pipeline unique en utilisant le jeu de données original penguins.csv.

  1. Supprimer les deux lignes avec des données insuffisantes.
  2. Construire un pipeline incluant l'encodage, l'imputation et la normalisation.

Vous devez encoder uniquement deux colonnes, 'sex' et 'island'. Comme vous ne souhaitez pas encoder l'ensemble de X, il est nécessaire d'utiliser un ColumnTransformer. Ensuite, appliquez le SimpleImputer et le StandardScaler à l'ensemble de X.

Voici un rappel des fonctions make_column_transformer() et make_pipeline() que vous utiliserez.

Tâche

Swipe to start coding

  1. Importer la fonction appropriée pour créer un pipeline.
  2. Créer un ColumnTransformer avec le OneHotEncoder appliqué uniquement aux colonnes 'sex' et 'island'.
  3. S'assurer que toutes les autres colonnes restent inchangées.
  4. Créer un pipeline contenant le ct que vous venez de créer, un SimpleImputer qui remplit les valeurs manquantes avec la valeur la plus fréquente, et un StandardScaler en dernière étape.
  5. Transformer X en utilisant le pipe que vous avez créé.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Création d'un Pipeline

Glissez pour afficher le menu

Dans ce défi, regroupez toutes les étapes de prétraitement dans un pipeline unique en utilisant le jeu de données original penguins.csv.

  1. Supprimer les deux lignes avec des données insuffisantes.
  2. Construire un pipeline incluant l'encodage, l'imputation et la normalisation.

Vous devez encoder uniquement deux colonnes, 'sex' et 'island'. Comme vous ne souhaitez pas encoder l'ensemble de X, il est nécessaire d'utiliser un ColumnTransformer. Ensuite, appliquez le SimpleImputer et le StandardScaler à l'ensemble de X.

Voici un rappel des fonctions make_column_transformer() et make_pipeline() que vous utiliserez.

Tâche

Swipe to start coding

  1. Importer la fonction appropriée pour créer un pipeline.
  2. Créer un ColumnTransformer avec le OneHotEncoder appliqué uniquement aux colonnes 'sex' et 'island'.
  3. S'assurer que toutes les autres colonnes restent inchangées.
  4. Créer un pipeline contenant le ct que vous venez de créer, un SimpleImputer qui remplit les valeurs manquantes avec la valeur la plus fréquente, et un StandardScaler en dernière étape.
  5. Transformer X en utilisant le pipe que vous avez créé.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

close

Awesome!

Completion rate improved to 3.13
Section 3. Chapitre 4
single

single

some-alt