Défi : Création d'un Pipeline
Dans ce défi, regroupez toutes les étapes de prétraitement dans un pipeline unique en utilisant le jeu de données original penguins.csv
.
- Supprimer les deux lignes avec des données insuffisantes.
- Construire un pipeline incluant l'encodage, l'imputation et la normalisation.
Vous devez encoder uniquement deux colonnes, 'sex'
et 'island'
. Comme vous ne souhaitez pas encoder l'ensemble de X
, il est nécessaire d'utiliser un ColumnTransformer
. Ensuite, appliquez le SimpleImputer
et le StandardScaler
à l'ensemble de X
.
Voici un rappel des fonctions make_column_transformer()
et make_pipeline()
que vous utiliserez.
Swipe to start coding
- Importer la fonction appropriée pour créer un pipeline.
- Créer un
ColumnTransformer
avec leOneHotEncoder
appliqué uniquement aux colonnes'sex'
et'island'
. - S'assurer que toutes les autres colonnes restent inchangées.
- Créer un pipeline contenant le
ct
que vous venez de créer, unSimpleImputer
qui remplit les valeurs manquantes avec la valeur la plus fréquente, et unStandardScaler
en dernière étape. - Transformer
X
en utilisant lepipe
que vous avez créé.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Défi : Création d'un Pipeline
Glissez pour afficher le menu
Dans ce défi, regroupez toutes les étapes de prétraitement dans un pipeline unique en utilisant le jeu de données original penguins.csv
.
- Supprimer les deux lignes avec des données insuffisantes.
- Construire un pipeline incluant l'encodage, l'imputation et la normalisation.
Vous devez encoder uniquement deux colonnes, 'sex'
et 'island'
. Comme vous ne souhaitez pas encoder l'ensemble de X
, il est nécessaire d'utiliser un ColumnTransformer
. Ensuite, appliquez le SimpleImputer
et le StandardScaler
à l'ensemble de X
.
Voici un rappel des fonctions make_column_transformer()
et make_pipeline()
que vous utiliserez.
Swipe to start coding
- Importer la fonction appropriée pour créer un pipeline.
- Créer un
ColumnTransformer
avec leOneHotEncoder
appliqué uniquement aux colonnes'sex'
et'island'
. - S'assurer que toutes les autres colonnes restent inchangées.
- Créer un pipeline contenant le
ct
que vous venez de créer, unSimpleImputer
qui remplit les valeurs manquantes avec la valeur la plus fréquente, et unStandardScaler
en dernière étape. - Transformer
X
en utilisant lepipe
que vous avez créé.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.13single