Implementação em Conjunto de Dados Real
Deslize para mostrar o menu
Será utilizado o conjunto de dados mall customers, que contém as seguintes colunas:
Também é necessário seguir estes passos antes da clusterização:
- Carregar os dados: utilização do
pandaspara carregar o arquivo CSV; - Selecionar as variáveis relevantes: foco nas colunas
'Annual Income (k$)'e'Spending Score (1-100)'; - Escalonamento dos dados (importante para o DBSCAN): como o DBSCAN utiliza cálculos de distância, é fundamental escalonar as variáveis para que tenham faixas semelhantes. Pode-se utilizar o
StandardScalerpara esse fim.
Interpretação
O código cria 5 clusters neste caso. É importante analisar os clusters resultantes para obter insights sobre a segmentação de clientes. Por exemplo, você pode encontrar clusters que representam:
- Clientes de alta renda e alto gasto;
- Clientes de alta renda e baixo gasto;
- Clientes de baixa renda e alto gasto;
- Clientes de baixa renda e baixo gasto;
- Clientes de renda média e gasto médio.
Considerações Finais
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 5. Capítulo 5
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Seção 5. Capítulo 5