Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Scikit-learn Begreber | Forbehandling af Data med Scikit-learn
ML Introduktion med Scikit-learn

bookScikit-learn Begreber

Biblioteket scikit-learn (importeret som sklearn) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn-objekter er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() betragtes som en estimator. Metoden .fit() gør det muligt for et objekt at lære fra data.

Med andre ord bruges .fit()-metoden til træning af et objekt. Den tager parametrene X og y (y er valgfri for opgaver med ikke-superviseret læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.

Transformer

En transformer har metoderne .fit() og .transform(), som på en eller anden måde transformerer dataene.

Normalt skal transformere lære noget fra data før de kan transformere, så du skal anvende .fit() og derefter .transform(). For at undgå dette har transformere også metoden .fit_transform().
.fit_transform() giver samme resultat som at anvende .fit() og .transform() sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Bemærk

Transformere bruges normalt til at transformere X-arrayet. Som vi vil se i eksemplet med LabelEncoder, er nogle transformere dog lavet til y-arrayet.

nan-værdier vist i træningssættet på billedet angiver manglende data i Python.

Predictor

En predictor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() bruges til at lave forudsigelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

En model er en type predictor, der også inkluderer metoden .score(). Denne metode beregner en score (metrik) for at måle predictorens præstation.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nævnt i det forrige kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.

Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.

question mark

Vælg alle korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between a transformer and a predictor?

What are some common examples of transformers and predictors in scikit-learn?

How do I choose which scikit-learn object to use for my task?

Awesome!

Completion rate improved to 3.13

bookScikit-learn Begreber

Stryg for at vise menuen

Biblioteket scikit-learn (importeret som sklearn) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn-objekter er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() betragtes som en estimator. Metoden .fit() gør det muligt for et objekt at lære fra data.

Med andre ord bruges .fit()-metoden til træning af et objekt. Den tager parametrene X og y (y er valgfri for opgaver med ikke-superviseret læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.

Transformer

En transformer har metoderne .fit() og .transform(), som på en eller anden måde transformerer dataene.

Normalt skal transformere lære noget fra data før de kan transformere, så du skal anvende .fit() og derefter .transform(). For at undgå dette har transformere også metoden .fit_transform().
.fit_transform() giver samme resultat som at anvende .fit() og .transform() sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Bemærk

Transformere bruges normalt til at transformere X-arrayet. Som vi vil se i eksemplet med LabelEncoder, er nogle transformere dog lavet til y-arrayet.

nan-værdier vist i træningssættet på billedet angiver manglende data i Python.

Predictor

En predictor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() bruges til at lave forudsigelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

En model er en type predictor, der også inkluderer metoden .score(). Denne metode beregner en score (metrik) for at måle predictorens præstation.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nævnt i det forrige kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.

Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.

question mark

Vælg alle korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
some-alt