Implementazione su un Dataset Reale
Verrà utilizzato il dataset mall customers, che contiene le seguenti colonne:
Si consiglia inoltre di seguire questi passaggi prima del clustering:
- Caricamento dei dati: utilizzo di
pandasper caricare il file CSV; - Selezione delle feature rilevanti: concentrazione sulle colonne
'Annual Income (k$)'e'Spending Score (1-100)'; - Scaling dei dati (importante per DBSCAN): poiché DBSCAN utilizza calcoli di distanza, è fondamentale scalare le feature per avere intervalli simili. È possibile utilizzare
StandardScalera questo scopo.
Interpretazione
Il codice crea 5 cluster in questo caso. È importante analizzare i cluster risultanti per ottenere informazioni sulla segmentazione dei clienti. Ad esempio, si possono individuare cluster che rappresentano:
- Clienti ad alto reddito e alta spesa;
- Clienti ad alto reddito e bassa spesa;
- Clienti a basso reddito e alta spesa;
- Clienti a basso reddito e bassa spesa;
- Clienti a reddito medio e spesa media.
Osservazioni Conclusive
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 2.94
Implementazione su un Dataset Reale
Scorri per mostrare il menu
Verrà utilizzato il dataset mall customers, che contiene le seguenti colonne:
Si consiglia inoltre di seguire questi passaggi prima del clustering:
- Caricamento dei dati: utilizzo di
pandasper caricare il file CSV; - Selezione delle feature rilevanti: concentrazione sulle colonne
'Annual Income (k$)'e'Spending Score (1-100)'; - Scaling dei dati (importante per DBSCAN): poiché DBSCAN utilizza calcoli di distanza, è fondamentale scalare le feature per avere intervalli simili. È possibile utilizzare
StandardScalera questo scopo.
Interpretazione
Il codice crea 5 cluster in questo caso. È importante analizzare i cluster risultanti per ottenere informazioni sulla segmentazione dei clienti. Ad esempio, si possono individuare cluster che rappresentano:
- Clienti ad alto reddito e alta spesa;
- Clienti ad alto reddito e bassa spesa;
- Clienti a basso reddito e alta spesa;
- Clienti a basso reddito e bassa spesa;
- Clienti a reddito medio e spesa media.
Osservazioni Conclusive
Grazie per i tuoi commenti!