Implementering på Virkelig Datasett
Sveip for å vise menyen
Du skal bruke mall customers-datasettet, som inneholder følgende kolonner:
Følg også disse stegene før klynging:
- Last inn data: bruk
pandasfor å laste inn CSV-filen; - Velg relevante variabler: fokuser på kolonnene
'Annual Income (k$)'og'Spending Score (1-100)'; - Skalering av data (viktig for DBSCAN): siden DBSCAN benytter avstandskalkulasjoner, er det viktig å skalere variablene slik at de har lignende verdier. Du kan bruke
StandardScalertil dette formålet.
Tolkning
Koden oppretter 5 klynger i dette tilfellet. Det er viktig å analysere de resulterende klyngene for å få innsikt i kundesegmentering. For eksempel kan du finne klynger som representerer:
- Kunder med høy inntekt og høyt forbruk;
- Kunder med høy inntekt og lavt forbruk;
- Kunder med lav inntekt og høyt forbruk;
- Kunder med lav inntekt og lavt forbruk;
- Kunder med middels inntekt og middels forbruk.
Avsluttende bemerkninger
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 5. Kapittel 5
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Seksjon 5. Kapittel 5