Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Creación de un Pipeline | Tuberías
Introducción al ML con Scikit-learn

bookDesafío: Creación de un Pipeline

En este desafío, combinar todos los pasos de preprocesamiento en un único pipeline utilizando el conjunto de datos original penguins.csv.

  1. Eliminar las dos filas con datos insuficientes.
  2. Construir un pipeline que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no se desea codificar todo X, se debe utilizar un ColumnTransformer. Posteriormente, aplicar SimpleImputer y StandardScaler a todo X.

A continuación, un recordatorio de las funciones make_column_transformer() y make_pipeline() que se utilizarán.

Tarea

Swipe to start coding

  1. Importar la función correcta para crear un pipeline.
  2. Crear un ColumnTransformer aplicando el OneHotEncoder solo a las columnas 'sex' e 'island'.
  3. Asegurarse de que todas las demás columnas permanezcan sin cambios.
  4. Crear un pipeline que contenga el ct que acaba de crear, un SimpleImputer que complete los valores faltantes con el valor más frecuente y un StandardScaler como último paso.
  5. Transformar X utilizando el pipe que creó.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Creación de un Pipeline

Desliza para mostrar el menú

En este desafío, combinar todos los pasos de preprocesamiento en un único pipeline utilizando el conjunto de datos original penguins.csv.

  1. Eliminar las dos filas con datos insuficientes.
  2. Construir un pipeline que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no se desea codificar todo X, se debe utilizar un ColumnTransformer. Posteriormente, aplicar SimpleImputer y StandardScaler a todo X.

A continuación, un recordatorio de las funciones make_column_transformer() y make_pipeline() que se utilizarán.

Tarea

Swipe to start coding

  1. Importar la función correcta para crear un pipeline.
  2. Crear un ColumnTransformer aplicando el OneHotEncoder solo a las columnas 'sex' e 'island'.
  3. Asegurarse de que todas las demás columnas permanezcan sin cambios.
  4. Crear un pipeline que contenga el ct que acaba de crear, un SimpleImputer que complete los valores faltantes con el valor más frecuente y un StandardScaler como último paso.
  5. Transformar X utilizando el pipe que creó.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

some-alt