Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafío 1: Escalado de Datos | Scikit-learn
Desafío de Entrevista en Ciencia de Datos
course content

Contenido del Curso

Desafío de Entrevista en Ciencia de Datos

Desafío de Entrevista en Ciencia de Datos

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estadísticas
7. Scikit-learn

book
Desafío 1: Escalado de Datos

En el ámbito de la ciencia de datos y el aprendizaje automático, el escalado de datos es un preprocesamiento crítico. Consiste principalmente en transformar las características (variables) del conjunto de datos a una escala estándar, garantizando que cada característica tenga una escala similar o rango. Esto es especialmente importante para los algoritmos que se basan en distancias o gradientes, ya que garantiza que todas las características contribuyan por igual al resultado y que el algoritmo converja de forma más eficaz.

He aquí una demostración de cómo las utilidades de escalado de scikit-learn modifican la distribución de los datos:

Tarea
test

Swipe to show code editor

En esta tarea, trabajarás con el popular conjunto de datos Iris. Su objetivo es aplicar dos tipos de escaladores a los datos y comparar los conjuntos de datos resultantes.

  1. Utilice la clase StandardScaler para estandarizar el conjunto de datos, lo que significa transformarlo para que tenga una media de 0 y una desviación estándar de 1.
    1. Utilice la clase MinMaxScaler para reescalar el conjunto de datos. Asegúrese de que después de la escala, los valores de las características se encuentran entre -1 y 1.
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 7. Capítulo 1
toggle bottom row

book
Desafío 1: Escalado de Datos

En el ámbito de la ciencia de datos y el aprendizaje automático, el escalado de datos es un preprocesamiento crítico. Consiste principalmente en transformar las características (variables) del conjunto de datos a una escala estándar, garantizando que cada característica tenga una escala similar o rango. Esto es especialmente importante para los algoritmos que se basan en distancias o gradientes, ya que garantiza que todas las características contribuyan por igual al resultado y que el algoritmo converja de forma más eficaz.

He aquí una demostración de cómo las utilidades de escalado de scikit-learn modifican la distribución de los datos:

Tarea
test

Swipe to show code editor

En esta tarea, trabajarás con el popular conjunto de datos Iris. Su objetivo es aplicar dos tipos de escaladores a los datos y comparar los conjuntos de datos resultantes.

  1. Utilice la clase StandardScaler para estandarizar el conjunto de datos, lo que significa transformarlo para que tenga una media de 0 y una desviación estándar de 1.
    1. Utilice la clase MinMaxScaler para reescalar el conjunto de datos. Asegúrese de que después de la escala, los valores de las características se encuentran entre -1 y 1.
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 7. Capítulo 1
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
We're sorry to hear that something went wrong. What happened?
some-alt