Types de Données
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.
La plupart des algorithmes de ML fonctionnent efficacement uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégoriques et de date/heure en nombres.
Pour les données de date et d'heure, des caractéristiques telles que 'year'
, 'month'
et similaires peuvent être extraites, selon la tâche. Ce sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégoriques sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, mais elles dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month'
, cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how to convert ordinal data into numerical values?
What are the common methods for encoding nominal data?
Why do machine learning algorithms require numerical data?
Awesome!
Completion rate improved to 3.13
Types de Données
Glissez pour afficher le menu
Chaque colonne (caractéristique) dans un ensemble d'entraînement possède un type de données qui lui est associé. Ces types de données peuvent être regroupés en numériques, catégoriques et date et/ou heure.
La plupart des algorithmes de ML fonctionnent efficacement uniquement avec des données numériques, il est donc nécessaire de convertir les valeurs catégoriques et de date/heure en nombres.
Pour les données de date et d'heure, des caractéristiques telles que 'year'
, 'month'
et similaires peuvent être extraites, selon la tâche. Ce sont déjà des valeurs numériques, elles peuvent donc être utilisées directement.
Les données catégoriques sont un peu plus complexes à traiter.
Types de données catégorielles
Les données catégorielles sont classées en deux types :
-
Données ordinales : type de données catégorielles dans lesquelles les catégories suivent un ordre naturel. Par exemple, le niveau d'éducation (de l'école primaire au doctorat) ou les évaluations (de très mauvais à très bon), etc. ;
-
Données nominales : type de données catégorielles qui ne suivent aucun ordre naturel. Par exemple, le nom, le genre, le pays d'origine, etc.
La conversion des types de données ordinales et nominales en valeurs numériques nécessite des approches différentes, elles doivent donc être traitées séparément.
Il existe de meilleures méthodes pour convertir les dates en valeurs numériques, mais elles dépassent le cadre de ce cours d'introduction. Par exemple, si l'on utilise uniquement la caractéristique 'month'
, cela ne prend pas en compte que le 12e mois est en réalité plus proche du 1er que du 9e.
Merci pour vos commentaires !