Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafio 1: Escalonamento de Dados | Scikit-learn
Desafio de Entrevista em Ciência de Dados
course content

Conteúdo do Curso

Desafio de Entrevista em Ciência de Dados

Desafio de Entrevista em Ciência de Dados

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estatísticas
7. Scikit-learn

book
Desafio 1: Escalonamento de Dados

No mundo da ciência de dados e aprendizado de máquina, o escalamento de dados é um passo crítico de pré-processamento. Ele envolve principalmente a transformação das características (variáveis) do conjunto de dados para uma escala padrão, garantindo que cada característica tenha uma escala similar ou alcance. Isso é especialmente significativo para algoritmos que dependem de distâncias ou gradientes, pois assegura que todas as características contribuam igualmente para o resultado e o algoritmo converge mais eficientemente.

Aqui está uma demonstração de como as ferramentas de escalonamento do scikit-learn modificam a distribuição de dados:

Tarefa
test

Swipe to show code editor

Nesta tarefa, você trabalhará com o popular conjunto de dados Iris. Seu objetivo é aplicar dois tipos de escalonadores aos dados e comparar os conjuntos de dados resultantes.

  1. Utilize a classe StandardScaler para padronizar o conjunto de dados, o que significa transformá-lo para ter uma média de 0 e um desvio padrão de 1.
  2. Utilize a classe MinMaxScaler para reescalar o conjunto de dados. Garanta que, após a escala, os valores das características estejam entre -1 e 1.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 7. Capítulo 1
toggle bottom row

book
Desafio 1: Escalonamento de Dados

No mundo da ciência de dados e aprendizado de máquina, o escalamento de dados é um passo crítico de pré-processamento. Ele envolve principalmente a transformação das características (variáveis) do conjunto de dados para uma escala padrão, garantindo que cada característica tenha uma escala similar ou alcance. Isso é especialmente significativo para algoritmos que dependem de distâncias ou gradientes, pois assegura que todas as características contribuam igualmente para o resultado e o algoritmo converge mais eficientemente.

Aqui está uma demonstração de como as ferramentas de escalonamento do scikit-learn modificam a distribuição de dados:

Tarefa
test

Swipe to show code editor

Nesta tarefa, você trabalhará com o popular conjunto de dados Iris. Seu objetivo é aplicar dois tipos de escalonadores aos dados e comparar os conjuntos de dados resultantes.

  1. Utilize a classe StandardScaler para padronizar o conjunto de dados, o que significa transformá-lo para ter uma média de 0 e um desvio padrão de 1.
  2. Utilize a classe MinMaxScaler para reescalar o conjunto de dados. Garanta que, após a escala, os valores das características estejam entre -1 e 1.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 7. Capítulo 1
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
We're sorry to hear that something went wrong. What happened?
some-alt