Desafío 1: Escalado de Datos
En el ámbito de la ciencia de datos y el aprendizaje automático, el escalado de datos es un preprocesamiento crítico. Consiste principalmente en transformar las características (variables) del conjunto de datos a una escala estándar, garantizando que cada característica tenga una escala similar o rango. Esto es especialmente importante para los algoritmos que se basan en distancias o gradientes, ya que garantiza que todas las características contribuyan por igual al resultado y que el algoritmo converja de forma más eficaz.
He aquí una demostración de cómo las utilidades de escalado de scikit-learn modifican la distribución de los datos:
Swipe to start coding
En esta tarea, trabajarás con el popular conjunto de datos Iris. Su objetivo es aplicar dos tipos de escaladores a los datos y comparar los conjuntos de datos resultantes.
- Utilice la clase
StandardScaler
para estandarizar el conjunto de datos, lo que significa transformarlo para que tenga una media de0
y una desviación estándar de1
. -
- Utilice la clase
MinMaxScaler
para reescalar el conjunto de datos. Asegúrese de que después de la escala, los valores de las características se encuentran entre-1
y1
.
- Utilice la clase
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Resumir este capítulo
Explicar el código en file
Explicar por qué file no resuelve la tarea
Awesome!
Completion rate improved to 2.33
Desafío 1: Escalado de Datos
Desliza para mostrar el menú
En el ámbito de la ciencia de datos y el aprendizaje automático, el escalado de datos es un preprocesamiento crítico. Consiste principalmente en transformar las características (variables) del conjunto de datos a una escala estándar, garantizando que cada característica tenga una escala similar o rango. Esto es especialmente importante para los algoritmos que se basan en distancias o gradientes, ya que garantiza que todas las características contribuyan por igual al resultado y que el algoritmo converja de forma más eficaz.
He aquí una demostración de cómo las utilidades de escalado de scikit-learn modifican la distribución de los datos:
Swipe to start coding
En esta tarea, trabajarás con el popular conjunto de datos Iris. Su objetivo es aplicar dos tipos de escaladores a los datos y comparar los conjuntos de datos resultantes.
- Utilice la clase
StandardScaler
para estandarizar el conjunto de datos, lo que significa transformarlo para que tenga una media de0
y una desviación estándar de1
. -
- Utilice la clase
MinMaxScaler
para reescalar el conjunto de datos. Asegúrese de que después de la escala, los valores de las características se encuentran entre-1
y1
.
- Utilice la clase
Solución
¡Gracias por tus comentarios!
Awesome!
Completion rate improved to 2.33single