Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafio 3: Pipelines | Scikit-learn
Desafio de Entrevista em Ciência de Dados
course content

Conteúdo do Curso

Desafio de Entrevista em Ciência de Dados

Desafio de Entrevista em Ciência de Dados

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estatísticas
7. Scikit-learn

book
Desafio 3: Pipelines

As Pipelines desempenham um papel crucial na racionalização dos fluxos de trabalho de aprendizado de máquina, garantindo a transição coerente e eficiente dos dados de uma etapa de processamento para outra. Essencialmente, uma pipeline agrupa uma sequência de etapas de processamento de dados e modelagem em uma única estrutura unificada. A principal vantagem do uso de pipelines é a minimização de erros comuns de fluxo de trabalho, como o vazamento de dados ao padronizar ou normalizar os dados.

Tarefa
test

Swipe to show code editor

Aplique a normalização dos dados ao conjunto de dados de vinho, e depois utilize o algoritmo KMeans para agrupar vinhos com base em suas propriedades químicas.

  1. Aplique a padronização dos dados às características do conjunto de dados de vinho.
  2. Utilize o algoritmo KMeans para agrupar os vinhos baseando-se em suas propriedades químicas. São necessários 3 grupos.
  3. Aplique o pipeline aos dados.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 7. Capítulo 3
toggle bottom row

book
Desafio 3: Pipelines

As Pipelines desempenham um papel crucial na racionalização dos fluxos de trabalho de aprendizado de máquina, garantindo a transição coerente e eficiente dos dados de uma etapa de processamento para outra. Essencialmente, uma pipeline agrupa uma sequência de etapas de processamento de dados e modelagem em uma única estrutura unificada. A principal vantagem do uso de pipelines é a minimização de erros comuns de fluxo de trabalho, como o vazamento de dados ao padronizar ou normalizar os dados.

Tarefa
test

Swipe to show code editor

Aplique a normalização dos dados ao conjunto de dados de vinho, e depois utilize o algoritmo KMeans para agrupar vinhos com base em suas propriedades químicas.

  1. Aplique a padronização dos dados às características do conjunto de dados de vinho.
  2. Utilize o algoritmo KMeans para agrupar os vinhos baseando-se em suas propriedades químicas. São necessários 3 grupos.
  3. Aplique o pipeline aos dados.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 7. Capítulo 3
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
We're sorry to hear that something went wrong. What happened?
some-alt