Desafio: Criando um Pipeline
Neste desafio, combine todas as etapas de pré-processamento em um único pipeline utilizando o dataset original penguins.csv.
- Remova as duas linhas com dados insuficientes.
- Construa um pipeline que inclua codificação, imputação e padronização.
É necessário codificar apenas duas colunas, 'sex' e 'island'. Como não se deseja codificar todo o X, é preciso utilizar um ColumnTransformer. Em seguida, aplique o SimpleImputer e o StandardScaler em todo o X.
Aqui está um lembrete das funções make_column_transformer() e make_pipeline() que serão utilizadas.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Seu objetivo é construir um pipeline de pré-processamento que trate valores ausentes, codifique colunas categóricas e normalize características numéricas.
- Importe a função
make_pipelinedesklearn.pipeline. - Crie um
ColumnTransformerchamadoctque aplica umOneHotEncoderàs colunas'sex'e'island', mantendo todas as outras colunas inalteradas (remainder='passthrough'). - Crie um pipeline que inclua as seguintes etapas, nesta ordem:
- O
ColumnTransformerque você definiu (ct); - Um
SimpleImputercom a estratégia definida como'most_frequent'; - Um
StandardScalerpara normalização das características.
- Aplique o pipeline à matriz de características
Xe armazene os dados transformados em uma variável chamadaX_transformed.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Desafio: Criando um Pipeline
Deslize para mostrar o menu
Neste desafio, combine todas as etapas de pré-processamento em um único pipeline utilizando o dataset original penguins.csv.
- Remova as duas linhas com dados insuficientes.
- Construa um pipeline que inclua codificação, imputação e padronização.
É necessário codificar apenas duas colunas, 'sex' e 'island'. Como não se deseja codificar todo o X, é preciso utilizar um ColumnTransformer. Em seguida, aplique o SimpleImputer e o StandardScaler em todo o X.
Aqui está um lembrete das funções make_column_transformer() e make_pipeline() que serão utilizadas.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Seu objetivo é construir um pipeline de pré-processamento que trate valores ausentes, codifique colunas categóricas e normalize características numéricas.
- Importe a função
make_pipelinedesklearn.pipeline. - Crie um
ColumnTransformerchamadoctque aplica umOneHotEncoderàs colunas'sex'e'island', mantendo todas as outras colunas inalteradas (remainder='passthrough'). - Crie um pipeline que inclua as seguintes etapas, nesta ordem:
- O
ColumnTransformerque você definiu (ct); - Um
SimpleImputercom a estratégia definida como'most_frequent'; - Um
StandardScalerpara normalização das características.
- Aplique o pipeline à matriz de características
Xe armazene os dados transformados em uma variável chamadaX_transformed.
Solução
Obrigado pelo seu feedback!
single