Sección 2. Capítulo 8
single
Desafío: Codificación de Variables Categóricas
Desliza para mostrar el menú
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:
En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluido el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ten en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.
Tarea
Desliza para comenzar a programar
Se proporciona un DataFrame df. Codifica todas las columnas categóricas:
- Importar
OneHotEncoderyLabelEncoderdesdesklearn.preprocessing. - Dividir los datos en
X(características) ey(objetivo). - Crear un
OneHotEncodery aplicarlo a las columnas'island'y'sex'enX. - Reemplazar esas columnas originales por sus versiones codificadas.
- Utilizar
LabelEncoderen la columna'species'para codificary.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 2. Capítulo 8
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla