Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Pipeline de Pré-Processamento | Engenharia de Atributos para Aprendizado de Máquina
Pré-Processamento de Dados e Engenharia de Features

bookDesafio: Pipeline de Pré-Processamento

Tarefa

Swipe to start coding

Você recebeu o conjunto de dados Titanic da biblioteca seaborn. Sua tarefa é construir um pipeline completo de pré-processamento que realize todas as transformações essenciais de dados utilizadas antes do aprendizado de máquina.

Siga estes passos:

  1. Carregue o conjunto de dados usando sns.load_dataset("titanic").
  2. Trate os valores ausentes:
  • Colunas numéricas → preencher com a média.
  • Colunas categóricas → preencher com a moda.
  1. Codifique as variáveis categóricas sex e embarked utilizando pd.get_dummies().
  2. Escalone as colunas numéricas age e fare utilizando StandardScaler.
  3. Crie uma nova variável family_size = sibsp + parch + 1.
  4. Combine todas as transformações em uma função chamada preprocess_titanic(data) que retorna o DataFrame processado final.
  5. Atribua o conjunto de dados processado a uma variável chamada processed_data.

Exiba as 5 primeiras linhas do DataFrame final.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain that in simpler terms?

What are the main benefits of this approach?

Are there any common mistakes to avoid with this?

close

Awesome!

Completion rate improved to 8.33

bookDesafio: Pipeline de Pré-Processamento

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você recebeu o conjunto de dados Titanic da biblioteca seaborn. Sua tarefa é construir um pipeline completo de pré-processamento que realize todas as transformações essenciais de dados utilizadas antes do aprendizado de máquina.

Siga estes passos:

  1. Carregue o conjunto de dados usando sns.load_dataset("titanic").
  2. Trate os valores ausentes:
  • Colunas numéricas → preencher com a média.
  • Colunas categóricas → preencher com a moda.
  1. Codifique as variáveis categóricas sex e embarked utilizando pd.get_dummies().
  2. Escalone as colunas numéricas age e fare utilizando StandardScaler.
  3. Crie uma nova variável family_size = sibsp + parch + 1.
  4. Combine todas as transformações em uma função chamada preprocess_titanic(data) que retorna o DataFrame processado final.
  5. Atribua o conjunto de dados processado a uma variável chamada processed_data.

Exiba as 5 primeiras linhas do DataFrame final.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

some-alt