Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Pipeline de Preprocesamiento | Ingeniería de Características para Aprendizaje Automático
Preprocesamiento de Datos y Diseño de Características

bookDesafío: Pipeline de Preprocesamiento

Tarea

Swipe to start coding

Se proporciona el conjunto de datos Titanic de la biblioteca seaborn. La tarea consiste en construir una tubería completa de preprocesamiento que realice todas las transformaciones de datos esenciales previas al aprendizaje automático.

Siga estos pasos:

  1. Cargar el conjunto de datos utilizando sns.load_dataset("titanic").
  2. Manejar los valores faltantes:
  • Columnas numéricas → rellenar con la media.
  • Columnas categóricas → rellenar con la moda.
  1. Codificar las características categóricas sex y embarked utilizando pd.get_dummies().
  2. Escalar las columnas numéricas age y fare utilizando StandardScaler.
  3. Crear una nueva característica family_size = sibsp + parch + 1.
  4. Combinar todas las transformaciones en una función llamada preprocess_titanic(data) que devuelva el DataFrame procesado final.
  5. Asignar el conjunto de datos procesado a una variable llamada processed_data.

Imprimir las primeras 5 filas del DataFrame final.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 8.33

bookDesafío: Pipeline de Preprocesamiento

Desliza para mostrar el menú

Tarea

Swipe to start coding

Se proporciona el conjunto de datos Titanic de la biblioteca seaborn. La tarea consiste en construir una tubería completa de preprocesamiento que realice todas las transformaciones de datos esenciales previas al aprendizaje automático.

Siga estos pasos:

  1. Cargar el conjunto de datos utilizando sns.load_dataset("titanic").
  2. Manejar los valores faltantes:
  • Columnas numéricas → rellenar con la media.
  • Columnas categóricas → rellenar con la moda.
  1. Codificar las características categóricas sex y embarked utilizando pd.get_dummies().
  2. Escalar las columnas numéricas age y fare utilizando StandardScaler.
  3. Crear una nueva característica family_size = sibsp + parch + 1.
  4. Combinar todas las transformaciones en una función llamada preprocess_titanic(data) que devuelva el DataFrame procesado final.
  5. Asignar el conjunto de datos procesado a una variable llamada processed_data.

Imprimir las primeras 5 filas del DataFrame final.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

some-alt