Реалізація на реальному наборі даних
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати наступні кроки перед кластеризацією:
- Завантаження даних: використання
pandasдля завантаження CSV-файлу; - Вибір релевантних ознак: фокусування на стовпцях
'Annual Income (k$)'та'Spending Score (1-100)'; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери для отримання уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
- Клієнти з високим доходом і високими витратами;
- Клієнти з високим доходом і низькими витратами;
- Клієнти з низьким доходом і високими витратами;
- Клієнти з низьким доходом і низькими витратами;
- Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 2.94
Реалізація на реальному наборі даних
Свайпніть щоб показати меню
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати наступні кроки перед кластеризацією:
- Завантаження даних: використання
pandasдля завантаження CSV-файлу; - Вибір релевантних ознак: фокусування на стовпцях
'Annual Income (k$)'та'Spending Score (1-100)'; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери для отримання уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
- Клієнти з високим доходом і високими витратами;
- Клієнти з високим доходом і низькими витратами;
- Клієнти з низьким доходом і високими витратами;
- Клієнти з низьким доходом і низькими витратами;
- Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!