Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafío 3: Tuberías | Scikit-learn
Desafío de Entrevista en Ciencia de Datos
course content

Contenido del Curso

Desafío de Entrevista en Ciencia de Datos

Desafío de Entrevista en Ciencia de Datos

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estadísticas
7. Scikit-learn

book
Desafío 3: Tuberías

Las pipelines desempeñan un papel crucial en la racionalización de los flujos de trabajo de aprendizaje automático, garantizando la transición coherente y eficiente de los datos de una etapa de procesamiento a otra. Básicamente, una canalización agrupa una secuencia de pasos de procesamiento de datos y modelado en una estructura única y unificada. La principal ventaja de utilizar pipelines es la minimización de errores comunes en el flujo de trabajo, como la fuga de datos al estandarizarlos o normalizarlos.

Tarea
test

Swipe to show code editor

Aplique el escalado de datos al conjunto de datos de vinos y, a continuación, utilice el algoritmo KMeans para agrupar los vinos en función de sus propiedades químicas.

  1. Aplique el escalado estándar de datos a las características del conjunto de datos de vinos.
    1. Utilice el algoritmo KMeans para agrupar los vinos en función de sus propiedades químicas. Se necesitan 3 clusters.
  2. Aplicar el pipeline a los datos
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 7. Capítulo 3
toggle bottom row

book
Desafío 3: Tuberías

Las pipelines desempeñan un papel crucial en la racionalización de los flujos de trabajo de aprendizaje automático, garantizando la transición coherente y eficiente de los datos de una etapa de procesamiento a otra. Básicamente, una canalización agrupa una secuencia de pasos de procesamiento de datos y modelado en una estructura única y unificada. La principal ventaja de utilizar pipelines es la minimización de errores comunes en el flujo de trabajo, como la fuga de datos al estandarizarlos o normalizarlos.

Tarea
test

Swipe to show code editor

Aplique el escalado de datos al conjunto de datos de vinos y, a continuación, utilice el algoritmo KMeans para agrupar los vinos en función de sus propiedades químicas.

  1. Aplique el escalado estándar de datos a las características del conjunto de datos de vinos.
    1. Utilice el algoritmo KMeans para agrupar los vinos en función de sus propiedades químicas. Se necesitan 3 clusters.
  2. Aplicar el pipeline a los datos
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 7. Capítulo 3
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
We're sorry to hear that something went wrong. What happened?
some-alt