Tipos de Datos
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
La mayoría de los algoritmos de ML funcionan bien solo con datos numéricos, por lo que los valores categóricos y de fecha/hora deben convertirse en números.
Para fecha y hora, se pueden extraer características como 'year'
, 'month'
y similares, dependiendo de la tarea. Estos ya son valores numéricos, por lo que pueden utilizarse directamente.
Los datos categóricos son un poco más difíciles de manejar.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel educativo (de escuela primaria a doctorado) o valoraciones (de muy malo a muy bueno), etc.;
-
Datos nominales: tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
La conversión de datos ordinales y nominales a valores numéricos requiere enfoques diferentes, por lo que deben tratarse por separado.
Existen mejores formas de convertir fechas a valores numéricos que van más allá del alcance de este curso introductorio. Por ejemplo, si solo se utiliza la característica 'month'
, no se considera que el 12º mes en realidad está más cerca del 1º que del 9º.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain how to convert ordinal data into numerical values?
What are the common methods for encoding nominal data?
Why do machine learning algorithms require numerical data?
Awesome!
Completion rate improved to 3.13
Tipos de Datos
Desliza para mostrar el menú
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
La mayoría de los algoritmos de ML funcionan bien solo con datos numéricos, por lo que los valores categóricos y de fecha/hora deben convertirse en números.
Para fecha y hora, se pueden extraer características como 'year'
, 'month'
y similares, dependiendo de la tarea. Estos ya son valores numéricos, por lo que pueden utilizarse directamente.
Los datos categóricos son un poco más difíciles de manejar.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel educativo (de escuela primaria a doctorado) o valoraciones (de muy malo a muy bueno), etc.;
-
Datos nominales: tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
La conversión de datos ordinales y nominales a valores numéricos requiere enfoques diferentes, por lo que deben tratarse por separado.
Existen mejores formas de convertir fechas a valores numéricos que van más allá del alcance de este curso introductorio. Por ejemplo, si solo se utiliza la característica 'month'
, no se considera que el 12º mes en realidad está más cerca del 1º que del 9º.
¡Gracias por tus comentarios!