Lære Gradientnedstigning | Matematisk Analyse

Definition

Gradient Descent er en optimeringsalgoritme, der minimerer en funktion ved iterativt at justere dens parametre i retning af det stejleste fald. Den er grundlæggende i maskinlæring, da den muliggør effektiv indlæring fra data for modeller.

Forståelse af gradienter

Gradienten af en funktion repræsenterer retningen og hældningen af funktionen på et givet punkt. Den angiver hvilken vej man skal bevæge sig for at minimere funktionen.

For en simpel funktion:

J(\theta) = \theta^2

Den afledte (gradienten) er:

\nabla J(\theta) = \frac{d}{d \theta}\left(\theta^2\right)= 2\theta

Dette betyder, at for enhver værdi af $θ$ , fortæller gradienten os, hvordan vi skal justere $θ$ for at bevæge os nedad mod minimum.

Gradient Descent-formel

Vægtopdateringsreglen er:

\theta \larr \theta - \alpha \nabla J(\theta)

Hvor:

$\theta$ - modelparameter;
$\alpha$ - læringsrate (skridtlængde);
$\nabla J(\theta)$ - gradienten af den funktion, vi ønsker at minimere.

For vores funktion:

\theta_{\text{new}} = \theta_{\text{old}} - \alpha\left(2\theta_{old}\right)

Dette betyder, at vi opdaterer $θ$ iterativt ved at trække den skalerede gradient fra.

Trinvist bevægelse – En visuel

Eksempel med startværdier: $\theta = 3$ , $\alpha = 0.3$

$\theta_1 = 3 - 0.3(2 \times 3) = 3 - 1.8 = 1.2;$
$\theta_2 = 1.2 - 0.3(2 \times 1.2) = 1.2 - 0.72 = 0.48;$
$\theta_3 = 0.48 - 0.3(2\times0.48) = 0.48 - 0.288 = 0.192;$
$\theta_4 = 0.192 - 0.3(2 \times 0.192) = 0.192 - 0.115 = 0.077.$

Efter nogle få iterationer nærmer vi os $θ=0$ , minimum.

Læringsrate – Vælg α med omhu

For stor $\ \alpha$ – overskrider, konvergerer aldrig;
For lille $\ \alpha$ – konvergerer for langsomt;
Optimal $\ \alpha$ – balancerer hastighed og nøjagtighed.

Hvornår stopper gradient descent?

Gradient descent stopper når:

\nabla J (\theta) \approx 0

Dette betyder, at yderligere opdateringer er ubetydelige, og vi har fundet et minimum.

Var alt klart?

Tak for dine kommentarer!

Sektion 3. Kapitel 9

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Stryg for at vise menuen