Conteúdo do Curso
Desafio de Entrevista em Ciência de Dados
Desafio de Entrevista em Ciência de Dados
Desafio 1: Escalonamento de Dados
No mundo da ciência de dados e aprendizado de máquina, o escalamento de dados é um passo crítico de pré-processamento. Ele envolve principalmente a transformação das características (variáveis) do conjunto de dados para uma escala padrão, garantindo que cada característica tenha uma escala similar ou alcance. Isso é especialmente significativo para algoritmos que dependem de distâncias ou gradientes, pois assegura que todas as características contribuam igualmente para o resultado e o algoritmo converge mais eficientemente.
Aqui está uma demonstração de como as ferramentas de escalonamento do scikit-learn modificam a distribuição de dados:
Swipe to show code editor
Nesta tarefa, você trabalhará com o popular conjunto de dados Iris. Seu objetivo é aplicar dois tipos de escalonadores aos dados e comparar os conjuntos de dados resultantes.
- Utilize a classe
StandardScaler
para padronizar o conjunto de dados, o que significa transformá-lo para ter uma média de0
e um desvio padrão de1
. - Utilize a classe
MinMaxScaler
para reescalar o conjunto de dados. Garanta que, após a escala, os valores das características estejam entre-1
e1
.
Obrigado pelo seu feedback!
Desafio 1: Escalonamento de Dados
No mundo da ciência de dados e aprendizado de máquina, o escalamento de dados é um passo crítico de pré-processamento. Ele envolve principalmente a transformação das características (variáveis) do conjunto de dados para uma escala padrão, garantindo que cada característica tenha uma escala similar ou alcance. Isso é especialmente significativo para algoritmos que dependem de distâncias ou gradientes, pois assegura que todas as características contribuam igualmente para o resultado e o algoritmo converge mais eficientemente.
Aqui está uma demonstração de como as ferramentas de escalonamento do scikit-learn modificam a distribuição de dados:
Swipe to show code editor
Nesta tarefa, você trabalhará com o popular conjunto de dados Iris. Seu objetivo é aplicar dois tipos de escalonadores aos dados e comparar os conjuntos de dados resultantes.
- Utilize a classe
StandardScaler
para padronizar o conjunto de dados, o que significa transformá-lo para ter uma média de0
e um desvio padrão de1
. - Utilize a classe
MinMaxScaler
para reescalar o conjunto de dados. Garanta que, após a escala, os valores das características estejam entre-1
e1
.
Obrigado pelo seu feedback!