Aprenda Implementação em Conjunto de Dados Real

Deslize para mostrar o menu

Será utilizado o conjunto de dados mall customers, que contém as seguintes colunas:

Também é necessário seguir estes passos antes da clusterização:

Carregar os dados: utilização do pandas para carregar o arquivo CSV;
Selecionar as variáveis relevantes: foco nas colunas 'Annual Income (k$)' e 'Spending Score (1-100)';
Escalonamento dos dados (importante para o DBSCAN): como o DBSCAN utiliza cálculos de distância, é fundamental escalonar as variáveis para que tenham faixas semelhantes. Pode-se utilizar o StandardScaler para esse fim.

Interpretação

O código cria 5 clusters neste caso. É importante analisar os clusters resultantes para obter insights sobre a segmentação de clientes. Por exemplo, você pode encontrar clusters que representam:

Clientes de alta renda e alto gasto;
Clientes de alta renda e baixo gasto;
Clientes de baixa renda e alto gasto;
Clientes de baixa renda e baixo gasto;
Clientes de renda média e gasto médio.

Considerações Finais

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 5. Capítulo 5

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 5. Capítulo 5