Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Implementação em Conjunto de Dados Real | DBSCAN
Análise de Clusters com Python

Implementação em Conjunto de Dados Real

Deslize para mostrar o menu

Será utilizado o conjunto de dados mall customers, que contém as seguintes colunas:

Também é necessário seguir estes passos antes da clusterização:

  1. Carregar os dados: utilização do pandas para carregar o arquivo CSV;
  2. Selecionar as variáveis relevantes: foco nas colunas 'Annual Income (k$)' e 'Spending Score (1-100)';
  3. Escalonamento dos dados (importante para o DBSCAN): como o DBSCAN utiliza cálculos de distância, é fundamental escalonar as variáveis para que tenham faixas semelhantes. Pode-se utilizar o StandardScaler para esse fim.

Interpretação

O código cria 5 clusters neste caso. É importante analisar os clusters resultantes para obter insights sobre a segmentação de clientes. Por exemplo, você pode encontrar clusters que representam:

  • Clientes de alta renda e alto gasto;
  • Clientes de alta renda e baixo gasto;
  • Clientes de baixa renda e alto gasto;
  • Clientes de baixa renda e baixo gasto;
  • Clientes de renda média e gasto médio.
Clusters DBSCAN

Considerações Finais

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 5

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 5. Capítulo 5
some-alt