Tipi di Dati
Ogni colonna (caratteristica) in un set di addestramento ha un tipo di dato associato. Questi tipi di dati possono essere raggruppati in numerici, categorici e data e(o) ora.
La maggior parte degli algoritmi di ML funziona bene solo con dati numerici, quindi i valori categorici e datetime devono essere convertiti in numeri.
Per data e ora, è possibile estrarre caratteristiche come 'year'
, 'month'
e simili, a seconda del compito. Questi sono già valori numerici, quindi possono essere utilizzati direttamente.
I dati categorici sono un po' più complessi da gestire.
Tipi di Dati Categoriali
I dati categoriali si classificano in due tipologie:
-
Dati ordinali: tipologia di dati categoriali in cui le categorie seguono un ordine naturale. Ad esempio, livello di istruzione (dalla scuola elementare al dottorato) o valutazioni (da molto scarso a molto buono), ecc.;
-
Dati nominali: tipologia di dati categoriali che non seguono alcun ordine naturale. Ad esempio, nome, genere, paese di origine, ecc.
La conversione dei dati ordinali e nominali in valori numerici richiede approcci differenti, pertanto devono essere gestiti separatamente.
Esistono metodi più avanzati per convertire le date in valori numerici che vanno oltre gli argomenti di questo corso introduttivo. Ad esempio, se si utilizza solo la caratteristica 'month'
, non si tiene conto che il 12° mese è in realtà più vicino al 1° che al 9°.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain how to convert ordinal data into numerical values?
What are the common methods for encoding nominal data?
Why do machine learning algorithms require numerical data?
Awesome!
Completion rate improved to 3.13
Tipi di Dati
Scorri per mostrare il menu
Ogni colonna (caratteristica) in un set di addestramento ha un tipo di dato associato. Questi tipi di dati possono essere raggruppati in numerici, categorici e data e(o) ora.
La maggior parte degli algoritmi di ML funziona bene solo con dati numerici, quindi i valori categorici e datetime devono essere convertiti in numeri.
Per data e ora, è possibile estrarre caratteristiche come 'year'
, 'month'
e simili, a seconda del compito. Questi sono già valori numerici, quindi possono essere utilizzati direttamente.
I dati categorici sono un po' più complessi da gestire.
Tipi di Dati Categoriali
I dati categoriali si classificano in due tipologie:
-
Dati ordinali: tipologia di dati categoriali in cui le categorie seguono un ordine naturale. Ad esempio, livello di istruzione (dalla scuola elementare al dottorato) o valutazioni (da molto scarso a molto buono), ecc.;
-
Dati nominali: tipologia di dati categoriali che non seguono alcun ordine naturale. Ad esempio, nome, genere, paese di origine, ecc.
La conversione dei dati ordinali e nominali in valori numerici richiede approcci differenti, pertanto devono essere gestiti separatamente.
Esistono metodi più avanzati per convertire le date in valori numerici che vanno oltre gli argomenti di questo corso introduttivo. Ad esempio, se si utilizza solo la caratteristica 'month'
, non si tiene conto che il 12° mese è in realtà più vicino al 1° che al 9°.
Grazie per i tuoi commenti!