Impara Discesa del Gradiente | Analisi Matematica

Definizione

Discesa del gradiente è un algoritmo di ottimizzazione che minimizza una funzione regolando iterativamente i suoi parametri nella direzione della massima diminuzione. È fondamentale nell'apprendimento automatico per consentire ai modelli di apprendere in modo efficiente dai dati.

Comprensione dei gradienti

Il gradiente di una funzione rappresenta la direzione e la pendenza della funzione in un dato punto. Indica in quale direzione muoversi per minimizzare la funzione.

Per una funzione semplice:

J(\theta) = \theta^2

La derivata (gradiente) è:

\nabla J(\theta) = \frac{d}{d \theta}\left(\theta^2\right)= 2\theta

Questo significa che, per qualsiasi valore di $θ$ , il gradiente indica come regolare $θ$ per scendere verso il minimo.

Formula della discesa del gradiente

La regola di aggiornamento dei pesi è:

\theta \larr \theta - \alpha \nabla J(\theta)

Dove:

$\theta$ - parametro del modello;
$\alpha$ - tasso di apprendimento (ampiezza del passo);
$\nabla J(\theta)$ - gradiente della funzione che si vuole minimizzare.

Per la nostra funzione:

\theta_{\text{new}} = \theta_{\text{old}} - \alpha\left(2\theta_{old}\right)

Questo significa che aggiorniamo $θ$ iterativamente sottraendo il gradiente scalato.

Movimento a Passi – Un Esempio Visivo

Esempio con valori iniziali: $\theta = 3$ , $\alpha = 0.3$

$\theta_1 = 3 - 0.3(2 \times 3) = 3 - 1.8 = 1.2;$
$\theta_2 = 1.2 - 0.3(2 \times 1.2) = 1.2 - 0.72 = 0.48;$
$\theta_3 = 0.48 - 0.3(2\times0.48) = 0.48 - 0.288 = 0.192;$
$\theta_4 = 0.192 - 0.3(2 \times 0.192) = 0.192 - 0.115 = 0.077.$

Dopo alcune iterazioni, ci avviciniamo a $θ=0$ , il minimo.

Tasso di Apprendimento – Scelta Accurata di α

Troppo grande $\ \alpha$ - supera il minimo, non converge mai;
Troppo piccolo $\ \alpha$ - converge troppo lentamente;
Ottimale $\ \alpha$ - bilancia velocità e accuratezza.

Quando si Ferma il Gradient Descent?

Il gradient descent si ferma quando:

\nabla J (\theta) \approx 0

Questo significa che gli aggiornamenti successivi sono insignificanti e si è trovato un minimo.

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 9

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Scorri per mostrare il menu