Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Codificación Ordinal | Procesamiento de Datos Categóricos
Procesamiento Previo de Datos
course content

Contenido del Curso

Procesamiento Previo de Datos

Procesamiento Previo de Datos

1. Introducción Breve
2. Procesamiento de Datos Cuantitativos
3. Procesamiento de Datos Categóricos
4. Procesamiento de Datos de Series Temporales
5. Ingeniería de Características
6. Avanzando a Tareas

book
Codificación Ordinal

Si la codificación unívoca ha transformado una variable categórica en una forma binaria, la codificación ordinal utiliza un algoritmo de transformación diferente. Pero empecemos por los datos para los que se utiliza.

La codificación ordinal es una técnica para codificar variables categóricas en valores numéricos basados en el orden o rango de las categorías. Se utiliza mejor cuando existe una clasificación u orden claro de las categorías. Por ejemplo, en una encuesta en la que se pide a los encuestados que valoren su satisfacción con un producto, las opciones pueden ser "Muy satisfecho", "Satisfecho", "Neutral", "Insatisfecho" o "Muy insatisfecho". Estas opciones pueden codificarse como 5, 4, 3, 2 y 1.

Codificación ordinal - es un método útil para codificar datos categóricos cuando las categorías tienen un orden o clasificación natural. Sin embargo, debe utilizarse con precaución, ya que asume que la distancia entre cada categoría es igual, lo que puede no ser siempre el caso. Además, la codificación ordinal puede no ser adecuada para algoritmos que asumen una relación lineal entre las categorías codificadas, como la regresión lineal o las redes neuronales.

La codificación ordinal tiene en cuenta el orden en que se encuentran las variables categóricas, es decir, antes de utilizarla es importante ordenar las variables de la categoría más baja a la más alta.

He aquí cómo utilizar la codificación ordinal en Python:

1234567891011121314151617
import pandas as pd from sklearn.preprocessing import OrdinalEncoder # Read the dataset dataset = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/students.csv') cat_columns = ['Grade Level'] # Sorting categorical variables categories = [[None, "Freshman", "Sophomore", "Junior", "Senior"]] # Create an OrdinalEncoder model encoder = OrdinalEncoder(categories=categories) # Transform dataset dataset[cat_columns] = encoder.fit_transform(dataset[cat_columns]) print(dataset)
copy

El método .fit_transform() de la clase OrdinalEncoder ajusta el codificador a las variables categóricas y las transforma en valores numéricos.

Tarea
test

Swipe to show code editor

Lea el conjunto de datos 'controls.csv' y transforme la columna 'Education_Level' con codificación ordinal.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 3
toggle bottom row

book
Codificación Ordinal

Si la codificación unívoca ha transformado una variable categórica en una forma binaria, la codificación ordinal utiliza un algoritmo de transformación diferente. Pero empecemos por los datos para los que se utiliza.

La codificación ordinal es una técnica para codificar variables categóricas en valores numéricos basados en el orden o rango de las categorías. Se utiliza mejor cuando existe una clasificación u orden claro de las categorías. Por ejemplo, en una encuesta en la que se pide a los encuestados que valoren su satisfacción con un producto, las opciones pueden ser "Muy satisfecho", "Satisfecho", "Neutral", "Insatisfecho" o "Muy insatisfecho". Estas opciones pueden codificarse como 5, 4, 3, 2 y 1.

Codificación ordinal - es un método útil para codificar datos categóricos cuando las categorías tienen un orden o clasificación natural. Sin embargo, debe utilizarse con precaución, ya que asume que la distancia entre cada categoría es igual, lo que puede no ser siempre el caso. Además, la codificación ordinal puede no ser adecuada para algoritmos que asumen una relación lineal entre las categorías codificadas, como la regresión lineal o las redes neuronales.

La codificación ordinal tiene en cuenta el orden en que se encuentran las variables categóricas, es decir, antes de utilizarla es importante ordenar las variables de la categoría más baja a la más alta.

He aquí cómo utilizar la codificación ordinal en Python:

1234567891011121314151617
import pandas as pd from sklearn.preprocessing import OrdinalEncoder # Read the dataset dataset = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/students.csv') cat_columns = ['Grade Level'] # Sorting categorical variables categories = [[None, "Freshman", "Sophomore", "Junior", "Senior"]] # Create an OrdinalEncoder model encoder = OrdinalEncoder(categories=categories) # Transform dataset dataset[cat_columns] = encoder.fit_transform(dataset[cat_columns]) print(dataset)
copy

El método .fit_transform() de la clase OrdinalEncoder ajusta el codificador a las variables categóricas y las transforma en valores numéricos.

Tarea
test

Swipe to show code editor

Lea el conjunto de datos 'controls.csv' y transforme la columna 'Education_Level' con codificación ordinal.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 3
Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
We're sorry to hear that something went wrong. What happened?
some-alt