Summary  
This chapter covers computing principal components by formulating maximum-variance projection as an eigenvalue problem on the covariance matrix and extracting the leading eigenvector.  

General domain of usage  
Dimensionality reduction for data analysis.

La PCA cerca un nuovo insieme di assi, chiamati **componenti principali**, tali che i dati proiettati abbiano **varianza massima**. Il primo componente principale, indicato come $$w_{\raisebox{-0.5pt}{$1$}}$$, viene scelto per massimizzare la varianza dei dati proiettati:

$$
\mathrm{Var}(X w_1)
$$

Soggetto al vincolo che $$\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$$. La soluzione a questo problema di massimizzazione è il **vettore proprio** della matrice di covarianza corrispondente al più grande autovalore.

Il problema di ottimizzazione è:

$$
\max_{w} \ w^T \Sigma w \quad \text{subject to} \quad \|w\| = 1
$$

La soluzione è qualsiasi vettore $$w$$ che soddisfa $$\Sigma w = \lambda w$$, dove $$\lambda$$ è il corrispondente autovalore. In altre parole, $$w$$ è un **vettore proprio** della matrice di covarianza $$\Sigma$$ associato all'autovalore $$\lambda$$.

import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

**Questo componente principale** è la direzione lungo la quale i dati presentano la massima varianza. Proiettare i dati su questa direzione fornisce la rappresentazione **monodimensionale** più informativa del dataset originale.

Quale affermazione descrive meglio il ruolo della matrice di covarianza nella derivazione della PCA utilizzando l'algebra lineare

Un corso intermedio completo che guida gli studenti attraverso la motivazione, le basi matematiche e l'implementazione pratica dell'Analisi delle Componenti Principali (PCA) per la riduzione della dimensionalità in data science e machine learning.

Esplora la motivazione, le sfide e i vantaggi della riduzione delle dimensioni dei dati nell'apprendimento automatico e nella data science.

Esplorazione dei concetti matematici alla base della PCA, inclusi varianza, covarianza ed autovettori.

Applicazione della PCA a dataset reali utilizzando Python, interpretazione dei risultati, visualizzazione della varianza spiegata e dei carichi dei componenti, confronto delle prestazioni del modello prima e dopo la PCA.

Derivazione della PCA Tramite Algebra Lineare