Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Che cos'è la classificazione | Classificatore K-Nn
Classificazione con Python

bookChe cos'è la classificazione

Classificazione è un compito di apprendimento supervisionato. L'obiettivo è prevedere la classe a cui appartiene un'istanza sulla base di un insieme di parametri (feature). È necessario fornire molti esempi di dati etichettati (detti training set) affinché il computer possa apprendere prima di poter prevedere la classe di una nuova istanza.

La differenza tra classificazione e regressione è che la regressione prevede un valore numerico continuo, ad esempio un prezzo. Può essere qualsiasi numero reale (solo positivo per un prezzo).

Al contrario, la classificazione prevede un valore categorico, ad esempio il tipo di un dolce. Esiste un insieme finito di valori e il modello cerca di classificare ogni istanza in una di queste categorie.

In base alla formulazione di un problema, esistono diversi tipi di classificazione:

  • Classificazione binaria: nella classificazione binaria, un target può assumere uno di due possibili risultati. Ad esempio, email: spam/non spam, dolce: biscotto/non biscotto;

  • Classificazione multi-classe: nella classificazione multi-classe, ci sono tre o più possibili risultati per un target. Ad esempio, email: spam/importante/pubblicità/altro, dolce: biscotto/marshmallow/caramella;

  • Classificazione multi-etichetta: nella classificazione multi-etichetta, ogni istanza può appartenere a più classi contemporaneamente. Ad esempio, un film può essere classificato sia come azione che come commedia, oppure un'email può essere contrassegnata sia come importante che come lavorativa.

Per la maggior parte dei modelli di ML, è necessario codificare il target come un numero. Per la classificazione binaria, i risultati sono solitamente codificati come 0/1 (ad esempio, 1 - biscotto, 0 - non biscotto). Per una classificazione multi-classe, i risultati sono solitamente codificati come 0, 1, 2, ... (ad esempio, 0 - caramella, 1 - biscotto, 2 - marshmallow).

Molti modelli diversi possono eseguire la classificazione. Alcuni esempi includono:

  • k-Nearest Neighbors;
  • Regressione Logistica;
  • Albero Decisionale;
  • Random Forest.

Fortunatamente, sono tutti implementati nella libreria scikit-learn e sono facili da utilizzare.

Note
Nota

Nessun modello di machine learning è superiore agli altri. Quale modello offrirà le migliori prestazioni dipende dal compito specifico.

question mark

Qual è l'obiettivo principale della classificazione nel machine learning?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 1

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Awesome!

Completion rate improved to 4.17

bookChe cos'è la classificazione

Scorri per mostrare il menu

Classificazione è un compito di apprendimento supervisionato. L'obiettivo è prevedere la classe a cui appartiene un'istanza sulla base di un insieme di parametri (feature). È necessario fornire molti esempi di dati etichettati (detti training set) affinché il computer possa apprendere prima di poter prevedere la classe di una nuova istanza.

La differenza tra classificazione e regressione è che la regressione prevede un valore numerico continuo, ad esempio un prezzo. Può essere qualsiasi numero reale (solo positivo per un prezzo).

Al contrario, la classificazione prevede un valore categorico, ad esempio il tipo di un dolce. Esiste un insieme finito di valori e il modello cerca di classificare ogni istanza in una di queste categorie.

In base alla formulazione di un problema, esistono diversi tipi di classificazione:

  • Classificazione binaria: nella classificazione binaria, un target può assumere uno di due possibili risultati. Ad esempio, email: spam/non spam, dolce: biscotto/non biscotto;

  • Classificazione multi-classe: nella classificazione multi-classe, ci sono tre o più possibili risultati per un target. Ad esempio, email: spam/importante/pubblicità/altro, dolce: biscotto/marshmallow/caramella;

  • Classificazione multi-etichetta: nella classificazione multi-etichetta, ogni istanza può appartenere a più classi contemporaneamente. Ad esempio, un film può essere classificato sia come azione che come commedia, oppure un'email può essere contrassegnata sia come importante che come lavorativa.

Per la maggior parte dei modelli di ML, è necessario codificare il target come un numero. Per la classificazione binaria, i risultati sono solitamente codificati come 0/1 (ad esempio, 1 - biscotto, 0 - non biscotto). Per una classificazione multi-classe, i risultati sono solitamente codificati come 0, 1, 2, ... (ad esempio, 0 - caramella, 1 - biscotto, 2 - marshmallow).

Molti modelli diversi possono eseguire la classificazione. Alcuni esempi includono:

  • k-Nearest Neighbors;
  • Regressione Logistica;
  • Albero Decisionale;
  • Random Forest.

Fortunatamente, sono tutti implementati nella libreria scikit-learn e sono facili da utilizzare.

Note
Nota

Nessun modello di machine learning è superiore agli altri. Quale modello offrirà le migliori prestazioni dipende dal compito specifico.

question mark

Qual è l'obiettivo principale della classificazione nel machine learning?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 1
some-alt