Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Scikit-learn-Konsepter | Forbehandling av Data med Scikit-learn
ML-Introduksjon med Scikit-learn

bookScikit-learn-Konsepter

Biblioteket scikit-learn (importert som sklearn) tilbyr ulike funksjoner og klasser for forhåndsprosessering av data og modellering. De viktigste sklearn-objektene er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() regnes som en estimator. Metoden .fit() gjør det mulig for et objekt å lære fra data.

Med andre ord brukes .fit()-metoden til å trene et objekt. Den tar parameterne X og y (y er valgfri for oppgaver innen usupervisert læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttig om et objekt kun lærer fra data uten å produsere noe resultat. Mer praktiske er de to typene objekter som arver fra estimator: transformer og predictor.

Transformer

En transformer har metodene .fit() og .transform() som transformerer dataene på en eller annen måte.

Vanligvis må transformere lære noe fra dataene før de kan transformere, så du må bruke .fit() og deretter .transform(). For å forenkle dette, har transformere også metoden .fit_transform().
.fit_transform() gir samme resultat som å bruke .fit() og deretter .transform() sekvensielt, men er noen ganger raskere, så det er å foretrekke fremfor .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Merk

Transformere brukes vanligvis til å transformere X-arrayet. Men som vi skal se i eksempelet med LabelEncoder, er noen transformere laget for y-arrayet.

nan-verdier vist i treningssettet på bildet indikerer manglende data i Python.

Prediktor

En prediktor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() brukes til å gjøre prediksjoner.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modell

En modell er en type prediktor som også inkluderer metoden .score(). Denne metoden beregner en score (metrikker) for å måle prediktorens ytelse.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nevnt i forrige kapittel, er nøyaktighet en metrikk som representerer prosentandelen korrekte prediksjoner.

Forbehandlingsstadiet innebærer arbeid med transformatorer, og vi arbeider med prediktorer (mer spesifikt med modeller) i modelleringsstadiet.

question mark

Velg alle riktige påstander.

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 1

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 3.13

bookScikit-learn-Konsepter

Sveip for å vise menyen

Biblioteket scikit-learn (importert som sklearn) tilbyr ulike funksjoner og klasser for forhåndsprosessering av data og modellering. De viktigste sklearn-objektene er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() regnes som en estimator. Metoden .fit() gjør det mulig for et objekt å lære fra data.

Med andre ord brukes .fit()-metoden til å trene et objekt. Den tar parameterne X og y (y er valgfri for oppgaver innen usupervisert læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttig om et objekt kun lærer fra data uten å produsere noe resultat. Mer praktiske er de to typene objekter som arver fra estimator: transformer og predictor.

Transformer

En transformer har metodene .fit() og .transform() som transformerer dataene på en eller annen måte.

Vanligvis må transformere lære noe fra dataene før de kan transformere, så du må bruke .fit() og deretter .transform(). For å forenkle dette, har transformere også metoden .fit_transform().
.fit_transform() gir samme resultat som å bruke .fit() og deretter .transform() sekvensielt, men er noen ganger raskere, så det er å foretrekke fremfor .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Merk

Transformere brukes vanligvis til å transformere X-arrayet. Men som vi skal se i eksempelet med LabelEncoder, er noen transformere laget for y-arrayet.

nan-verdier vist i treningssettet på bildet indikerer manglende data i Python.

Prediktor

En prediktor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() brukes til å gjøre prediksjoner.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modell

En modell er en type prediktor som også inkluderer metoden .score(). Denne metoden beregner en score (metrikker) for å måle prediktorens ytelse.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nevnt i forrige kapittel, er nøyaktighet en metrikk som representerer prosentandelen korrekte prediksjoner.

Forbehandlingsstadiet innebærer arbeid med transformatorer, og vi arbeider med prediktorer (mer spesifikt med modeller) i modelleringsstadiet.

question mark

Velg alle riktige påstander.

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 1
some-alt