Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Criando um Pipeline | Pipelines
Introdução ao ML com Scikit-Learn

bookDesafio: Criando um Pipeline

Neste desafio, combine todas as etapas de pré-processamento em um único pipeline utilizando o dataset original penguins.csv.

  1. Remova as duas linhas com dados insuficientes.
  2. Construa um pipeline que inclua codificação, imputação e padronização.

É necessário codificar apenas duas colunas, 'sex' e 'island'. Como não se deseja codificar todo o X, é preciso utilizar um ColumnTransformer. Em seguida, aplique o SimpleImputer e o StandardScaler em todo o X.

Aqui está um lembrete das funções make_column_transformer() e make_pipeline() que serão utilizadas.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins. Seu objetivo é construir um pipeline de pré-processamento que trate valores ausentes, codifique colunas categóricas e normalize características numéricas.

  1. Importe a função make_pipeline de sklearn.pipeline.
  2. Crie um ColumnTransformer chamado ct que aplica um OneHotEncoder às colunas 'sex' e 'island', mantendo todas as outras colunas inalteradas (remainder='passthrough').
  3. Crie um pipeline que inclua as seguintes etapas, nesta ordem:
  • O ColumnTransformer que você definiu (ct);
  • Um SimpleImputer com a estratégia definida como 'most_frequent';
  • Um StandardScaler para normalização das características.
  1. Aplique o pipeline à matriz de características X e armazene os dados transformados em uma variável chamada X_transformed.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Criando um Pipeline

Deslize para mostrar o menu

Neste desafio, combine todas as etapas de pré-processamento em um único pipeline utilizando o dataset original penguins.csv.

  1. Remova as duas linhas com dados insuficientes.
  2. Construa um pipeline que inclua codificação, imputação e padronização.

É necessário codificar apenas duas colunas, 'sex' e 'island'. Como não se deseja codificar todo o X, é preciso utilizar um ColumnTransformer. Em seguida, aplique o SimpleImputer e o StandardScaler em todo o X.

Aqui está um lembrete das funções make_column_transformer() e make_pipeline() que serão utilizadas.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins. Seu objetivo é construir um pipeline de pré-processamento que trate valores ausentes, codifique colunas categóricas e normalize características numéricas.

  1. Importe a função make_pipeline de sklearn.pipeline.
  2. Crie um ColumnTransformer chamado ct que aplica um OneHotEncoder às colunas 'sex' e 'island', mantendo todas as outras colunas inalteradas (remainder='passthrough').
  3. Crie um pipeline que inclua as seguintes etapas, nesta ordem:
  • O ColumnTransformer que você definiu (ct);
  • Um SimpleImputer com a estratégia definida como 'most_frequent';
  • Um StandardScaler para normalização das características.
  1. Aplique o pipeline à matriz de características X e armazene os dados transformados em uma variável chamada X_transformed.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

some-alt