Impara Gestione dei Valori Mancanti | Concetti Fondamentali

Valori mancanti sono comuni nei dataset reali e devono essere gestiti prima del clustering. Verranno trattati tre metodi di base: imputazione con la media, imputazione con la mediana e rimozione delle righe.

Sostituzione con la Media

Questo metodo sostituisce i valori mancanti in una colonna con la media dei valori non mancanti. È semplice e mantiene la media della colonna.

# First option
df['column_name'].fillna(df['column_name'].mean(), inplace=True)

# Second option
df['column_name'] = df['column_name'].fillna(df['column_name'].mean())

Tuttavia, può ridurre la varianza e potrebbe non essere adatto per dati asimmetrici o variabili categoriche.

Sostituzione con la Mediana

Questo metodo sostituisce i valori mancanti con la mediana dei valori non mancanti nella colonna. La mediana è meno sensibile ai valori anomali rispetto alla media, risultando più adatta per dati asimmetrici o con outlier.

# First option
df['column_name'].fillna(df['column_name'].median(), inplace=True)

# Second option
df['column_name'] = df['column_name'].fillna(df['column_name'].median())

Rimozione delle righe con valori mancanti

Questo metodo elimina tutte le righe che contengono valori mancanti. È semplice e non introduce dati imputati. Tuttavia, può comportare una perdita significativa di dati e distorsioni se vengono rimosse molte righe o se la mancanza di dati non è casuale.

# First option
df.dropna(inplace=True)

# Second option
df = df.dropna()

La scelta del metodo migliore dipende dai dati e dagli obiettivi dell'analisi. Il file di codice mostra esempi pratici di ciascuna tecnica in modo più dettagliato.

Il file di codice qui sotto fornisce esempi pratici di ciascuna tecnica di pre-elaborazione trattata in questa sezione, inclusa la gestione dei valori mancanti:

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 1

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Scorri per mostrare il menu