Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Creación de un Pipeline | Tuberías
Introducción al ML con Scikit-learn

bookDesafío: Creación de un Pipeline

En este desafío, combinar todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv.

  1. Eliminar las dos filas con datos insuficientes.
  2. Construir una tubería que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no se desea codificar todo X, se debe utilizar un ColumnTransformer. Posteriormente, aplicar el SimpleImputer y el StandardScaler a todo X.

A continuación, un recordatorio de las funciones make_column_transformer() y make_pipeline() que se utilizarán.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df que contiene datos de pingüinos. El objetivo es construir un pipeline de preprocesamiento que gestione los valores faltantes, codifique las columnas categóricas y escale las características numéricas.

  1. Importar la función make_pipeline de sklearn.pipeline.
  2. Crear un ColumnTransformer llamado ct que aplique un OneHotEncoder a las columnas 'sex' e 'island', manteniendo todas las demás columnas sin cambios (remainder='passthrough').
  3. Crear un pipeline que incluya los siguientes pasos en orden:
  • El ColumnTransformer definido (ct);
  • Un SimpleImputer con la estrategia configurada en 'most_frequent';
  • Un StandardScaler para la normalización de características.
  1. Aplicar el pipeline a la matriz de características X y almacenar los datos transformados en una variable llamada X_transformed.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Creación de un Pipeline

Desliza para mostrar el menú

En este desafío, combinar todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv.

  1. Eliminar las dos filas con datos insuficientes.
  2. Construir una tubería que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no se desea codificar todo X, se debe utilizar un ColumnTransformer. Posteriormente, aplicar el SimpleImputer y el StandardScaler a todo X.

A continuación, un recordatorio de las funciones make_column_transformer() y make_pipeline() que se utilizarán.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df que contiene datos de pingüinos. El objetivo es construir un pipeline de preprocesamiento que gestione los valores faltantes, codifique las columnas categóricas y escale las características numéricas.

  1. Importar la función make_pipeline de sklearn.pipeline.
  2. Crear un ColumnTransformer llamado ct que aplique un OneHotEncoder a las columnas 'sex' e 'island', manteniendo todas las demás columnas sin cambios (remainder='passthrough').
  3. Crear un pipeline que incluya los siguientes pasos en orden:
  • El ColumnTransformer definido (ct);
  • Un SimpleImputer con la estrategia configurada en 'most_frequent';
  • Un StandardScaler para la normalización de características.
  1. Aplicar el pipeline a la matriz de características X y almacenar los datos transformados en una variable llamada X_transformed.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

some-alt