Summary  
This chapter explains how to use an estimator’s `.fit()`, `.predict()`, and `.score()` methods to train a model, generate predictions, and evaluate its performance.  

General domain of usage  
Supervised machine learning

Grunnleggende om dataprosessering og oppbygging av pipelines er nå dekket. Neste steg er **modellering**.


En **modell** i Scikit-learn er en **estimator** som tilbyr metodene `.predict()` og `.score()`, i tillegg til `.fit()` som arves fra alle estimatorer.


## .fit() 

Når dataene er forhåndsbehandlet og klare til å sendes til modellen, er det første steget i å bygge en modell **å trene en modell**. Dette gjøres ved å bruke `.fit(X, y)`.

For **overvåket læring** (regresjon, klassifisering) krever `.fit()` både `X` og `y`.
For **uovervåket læring** (f.eks. klynging) kaller du kun `.fit(X)`. Å sende med `y` gir ingen feil — det blir bare ignorert.

Merk

Under trening **lærer** modellen mønstre som trengs for prediksjon. Hva den lærer og hvor lang tid treningen tar avhenger av algoritmen. Trening er ofte den **tregeste delen** av maskinlæring, spesielt med store datasett.

## .predict()

Etter trening brukes `.predict()` for å generere prediksjoner:

```python
model.fit(X, y)
y_pred = model.predict(X_new)
```

## .score()

`.score()` evaluerer en trent modell, vanligvis på et **testsett**:

```python
model.fit(X, y)
model.score(X_test, y_test)
```

Sammenligner prediksjoner med faktiske målverdier. Standardmetrikken er **nøyaktighet** for klassifisering.

`X_test` refererer til delsettet av datasettet, kjent som **testsettet**, som brukes til å evaluere modellens ytelse etter trening. Det inneholder **funksjonene** (inndata). `y_test` er det tilsvarende delsettet av **sanne etiketter** for `X_test`. Sammen vurderer de hvor godt modellen predikerer nye, ukjente data.

Maskinlæring brukes nå overalt. Vil du lære det selv? Dette kurset er en introduksjon til maskinlæring hvor du lærer grunnleggende konsepter, arbeider med Scikit-learn – det mest populære biblioteket for ML, og bygger ditt første maskinlæringsprosjekt.
Kurset er beregnet på studenter med grunnleggende kunnskaper i Python, Pandas og Numpy.

Lær om maskinlæringskonsepter og arbeidsflyten i et ML-prosjekt.

Forbehandling er sannsynligvis den viktigste fasen i et ML-prosjekt. Dette kapittelet dekker forbehandlingsstegene som trengs for nesten alle datasett.

En pipeline er en ryddig måte å kombinere alle forhåndsprosesseringssteg samt en modell. Pipeliner gjør det mye enklere å trene og bruke en modell.

Modellering er den mest spennende fasen i et ML-prosjekt. La oss lære å bygge, finjustere og evaluere modellen!