Summary  
This chapter covers computing principal components by formulating maximum-variance projection as an eigenvalue problem on the covariance matrix and extracting the leading eigenvector.  

General domain of usage  
Dimensionality reduction for data analysis.

PCA zoekt een nieuwe set assen, genaamd **hoofdcomponenten**, zodat de geprojecteerde data **maximale variantie** heeft. De eerste hoofdcomponent, aangeduid als $$w_{\raisebox{-0.5pt}{$1$}}$$, wordt gekozen om de variantie van de geprojecteerde data te maximaliseren:

$$
\mathrm{Var}(X w_1)
$$

Onder de voorwaarde dat $$\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$$. De oplossing van dit maximalisatieprobleem is de **eigenvector** van de covariantiematrix die overeenkomt met de grootste eigenwaarde.

Het optimalisatieprobleem is:

$$
\max_{w} \ w^T \Sigma w \quad \text{onder de voorwaarde} \quad \|w\| = 1
$$

De oplossing is elke vector $$w$$ die voldoet aan $$\Sigma w = \lambda w$$, waarbij $$\lambda$$ de bijbehorende eigenwaarde is. Met andere woorden, $$w$$ is een **eigenvector** van de covariantiematrix $$\Sigma$$ die hoort bij eigenwaarde $$\lambda$$.

import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

**Deze hoofdcomponent** is de richting waarin de data de hoogste variantie heeft. Projectie van data op deze richting levert de meest informatieve **eendimensionale representatie** van de oorspronkelijke dataset op.

Welke uitspraak beschrijft het beste de rol van de covariantiematrix bij de afleiding van PCA met behulp van lineaire algebra?

Een uitgebreide cursus op gemiddeld niveau die cursisten begeleidt door de motivatie, wiskundige basis en praktische implementatie van Principal Component Analysis (PCA) voor dimensionaliteitsreductie in data science en machine learning.

Ontdek de motivatie, uitdagingen en voordelen van het reduceren van datadimensies in machine learning en datawetenschap.

Verdieping in de wiskundige concepten die ten grondslag liggen aan PCA, waaronder variantie, covariantie en eigenvectoren.

PCA toepassen op echte datasets met Python, de resultaten interpreteren, verklaarde variantie en componentladingen visualiseren, en modelprestaties vergelijken vóór en na PCA.

Afleiding van PCA met Behulp van Lineaire Algebra