Summary  
Scikit-learn organizes its components into four class types—estimators, transformers, predictors, and models—each defined by specific methods (.fit, .transform, .predict, .score) to build and evaluate data pipelines.

General domain of usage  
Machine learning (data preprocessing and predictive modeling)

Biblioteket **scikit-learn** (`sklearn`) tilbyr verktøy for forhåndsprosessering og modellering. Hovedobjekttypene er **estimator**, **transformer**, **predictor** og **model**.

## Estimator

Enhver klasse med `.fit()` er en estimator — den **lærer fra data**.

```python
estimator.fit(X, y)     # supervised  
estimator.fit(X)        # unsupervised
```

## Transformer

En transformer har `.fit()` og `.transform()`, samt `.fit_transform()` for å utføre begge samtidig.

Transformatorer brukes vanligvis til å transformere `X`-arrayen. Som vi skal se i eksempelet med `LabelEncoder`, er noen transformatorer laget for `y`-arrayen.

Merk

`nan`-verdier vist i treningssettet på bildet indikerer manglende data i Python.

## Prediktor

En prediktor er en estimator med `.predict()` for å generere utdata.

```python
predictor.fit(X, y)
predictor.predict(X_new)
```

## Modell

En modell er en prediktor med `.score()`, som evaluerer ytelsen.

```python
model.fit(X, y)
model.score(X, y)
```

Som nevnt i forrige kapittel, er **nøyaktighet** en metrikk som representerer prosentandelen korrekte prediksjoner.

**Forbehandling** innebærer arbeid med transformatorer, og vi arbeider med prediktorer (mer spesifikt med modeller) i **modelleringsfasen**.

Maskinlæring brukes nå overalt. Vil du lære det selv? Dette kurset er en introduksjon til maskinlæring hvor du lærer grunnleggende konsepter, arbeider med Scikit-learn – det mest populære biblioteket for ML, og bygger ditt første maskinlæringsprosjekt.
Kurset er beregnet på studenter med grunnleggende kunnskaper i Python, Pandas og Numpy.

Lær om maskinlæringskonsepter og arbeidsflyten i et ML-prosjekt.

Forbehandling er sannsynligvis den viktigste fasen i et ML-prosjekt. Dette kapittelet dekker forbehandlingsstegene som trengs for nesten alle datasett.

En pipeline er en ryddig måte å kombinere alle forhåndsprosesseringssteg samt en modell. Pipeliner gjør det mye enklere å trene og bruke en modell.

Modellering er den mest spennende fasen i et ML-prosjekt. La oss lære å bygge, finjustere og evaluere modellen!

Scikit-learn-Konsepter

Estimator

Transformer

Prediktor

Modell