Implémentation sur un Jeu de Données Réel
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le clustering :
- Charger les données : utilisation de
pandaspour charger le fichier CSV ; - Sélectionner les variables pertinentes : focalisation sur les colonnes
'Annual Income (k$)'et'Spending Score (1-100)'; - Mise à l'échelle des données (important pour DBSCAN) : comme DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les variables pour qu'elles aient des plages similaires. Utilisation possible de
StandardScalerà cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation des clients. Par exemple, il est possible d'identifier des clusters représentant :
- Clients à revenu élevé et à forte dépense ;
- Clients à revenu élevé et à faible dépense ;
- Clients à faible revenu et à forte dépense ;
- Clients à faible revenu et à faible dépense ;
- Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 2.94
Implémentation sur un Jeu de Données Réel
Glissez pour afficher le menu
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le clustering :
- Charger les données : utilisation de
pandaspour charger le fichier CSV ; - Sélectionner les variables pertinentes : focalisation sur les colonnes
'Annual Income (k$)'et'Spending Score (1-100)'; - Mise à l'échelle des données (important pour DBSCAN) : comme DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les variables pour qu'elles aient des plages similaires. Utilisation possible de
StandardScalerà cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation des clients. Par exemple, il est possible d'identifier des clusters représentant :
- Clients à revenu élevé et à forte dépense ;
- Clients à revenu élevé et à faible dépense ;
- Clients à faible revenu et à forte dépense ;
- Clients à faible revenu et à faible dépense ;
- Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !