Implementazione su Dataset Fittizio
Creerai due set di dati per dimostrare i punti di forza di DBSCAN:
-
Moons: due mezze lune intrecciate;
-
Circles: un piccolo cerchio all'interno di un cerchio più grande.
L'algoritmo è il seguente:
-
Si istanzia l'oggetto
DBSCAN
, impostandoeps
emin_samples
; -
Si adatta il modello ai dati;
-
Si visualizzano i risultati tracciando i punti dati e colorandoli in base alle rispettive etichette di cluster.
Ottimizzazione degli Iperparametri
La scelta di eps
e min_samples
influisce notevolmente sul risultato del clustering. Sperimenta con diversi valori per trovare quelli più adatti ai tuoi dati. Ad esempio, se eps
è troppo grande, tutti i punti potrebbero finire in un unico cluster. Se eps
è troppo piccolo, molti punti potrebbero essere classificati come rumore. È anche possibile scalare le caratteristiche.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What is the intuition behind why DBSCAN works better than K-means for these shapes?
How do I choose the best values for epsilon and min_samples in DBSCAN?
Can you explain the difference between core points and border points in DBSCAN?
Awesome!
Completion rate improved to 2.94
Implementazione su Dataset Fittizio
Scorri per mostrare il menu
Creerai due set di dati per dimostrare i punti di forza di DBSCAN:
-
Moons: due mezze lune intrecciate;
-
Circles: un piccolo cerchio all'interno di un cerchio più grande.
L'algoritmo è il seguente:
-
Si istanzia l'oggetto
DBSCAN
, impostandoeps
emin_samples
; -
Si adatta il modello ai dati;
-
Si visualizzano i risultati tracciando i punti dati e colorandoli in base alle rispettive etichette di cluster.
Ottimizzazione degli Iperparametri
La scelta di eps
e min_samples
influisce notevolmente sul risultato del clustering. Sperimenta con diversi valori per trovare quelli più adatti ai tuoi dati. Ad esempio, se eps
è troppo grande, tutti i punti potrebbero finire in un unico cluster. Se eps
è troppo piccolo, molti punti potrebbero essere classificati come rumore. È anche possibile scalare le caratteristiche.
Grazie per i tuoi commenti!