Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Codificación de Variables Categóricas | Preprocesamiento de Datos con Scikit-learn
Introducción al Aprendizaje Automático con Python
Sección 2. Capítulo 8
single

single

Desafío: Codificación de Variables Categóricas

Desliza para mostrar el menú

Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:

Codificación ordinal
Codificación one-hot

En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluido el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())

Ten en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.

Tarea

Desliza para comenzar a programar

Se proporciona un DataFrame df. Codifica todas las columnas categóricas:

  1. Importar OneHotEncoder y LabelEncoder desde sklearn.preprocessing.
  2. Dividir los datos en X (características) e y (objetivo).
  3. Crear un OneHotEncoder y aplicarlo a las columnas 'island' y 'sex' en X.
  4. Reemplazar esas columnas originales por sus versiones codificadas.
  5. Utilizar LabelEncoder en la columna 'species' para codificar y.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 8
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

some-alt