Impara Selezione delle Caratteristiche vs. Estrazione delle Caratteristiche | Introduzione alla Riduzione della Dimensionalità

Scorri per mostrare il menu

I dataset ad alta dimensionalità spesso presentano più caratteristiche di quante siano effettivamente necessarie. È possibile ridurre le caratteristiche utilizzando due strategie principali: selezione delle caratteristiche ed estrazione delle caratteristiche.

Selezione delle caratteristiche significa mantenere solo le caratteristiche originali più importanti, come scegliere i tuoi frutti preferiti da un cesto;
Estrazione delle caratteristiche crea nuove caratteristiche combinando o trasformando quelle originali, come frullare tutti i frutti in un unico smoothie.

L'Analisi delle Componenti Principali (PCA) è un metodo comune di estrazione delle caratteristiche, che verrà approfondito nei prossimi capitoli.


              12345678910111213141516171819202122
            
import pandas as pd
from sklearn.decomposition import PCA

# Example dataset
data = {
    'height': [150, 160, 170, 180],
    'weight': [50, 60, 70, 80],
    'age':    [20, 25, 30, 35],
    'score':  [85, 90, 95, 100]
}
df = pd.DataFrame(data)

# Feature selection: pick only 'height' and 'weight'
selected_features = df[['height', 'weight']]
print("Selected features (feature selection):")
print(selected_features)

# Feature extraction: combine features using PCA (placeholder, details later)
pca = PCA(n_components=2)
extracted_features = pca.fit_transform(df)
print("\nExtracted features (feature extraction, via PCA):")
print(extracted_features)

Nota

La PCA è una potente tecnica di estrazione delle caratteristiche che crea nuove caratteristiche (componenti principali) a partire dai dati originali. I dettagli sul funzionamento della PCA saranno trattati nei prossimi capitoli.

Ridurre il numero di caratteristiche può aiutare a individuare schemi che potrebbero essere nascosti in dimensioni superiori. Utilizzando la visualizzazione, è possibile tracciare le caratteristiche selezionate per rivelare cluster o tendenze in modo più chiaro. Ad esempio, rappresentare graficamente solo le caratteristiche più rilevanti con seaborn può mettere in evidenza le relazioni nei dati, rendendo più semplice l'interpretazione e l'analisi.

Quale affermazione descrive meglio la differenza tra selezione delle caratteristiche ed estrazione delle caratteristiche nella riduzione della dimensionalità

Select the correct answer

La selezione delle caratteristiche viene utilizzata solo nei dati di immagini, mentre l'estrazione delle caratteristiche viene utilizzata solo nei dati di testo.

La selezione delle caratteristiche mantiene le caratteristiche originali, mentre l'estrazione delle caratteristiche crea nuove caratteristiche combinando o trasformando quelle originali.

L'estrazione delle caratteristiche rimuove tutti i dati irrilevanti, mentre la selezione delle caratteristiche non lo fa.

La selezione delle caratteristiche migliora sempre l'accuratezza del modello, mentre l'estrazione delle caratteristiche la riduce sempre.

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 3

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 1. Capitolo 3