Scikit-learn Begreber
Biblioteket scikit-learn (importeret som sklearn
) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn
-objekter er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
betragtes som en estimator. Metoden .fit()
gør det muligt for et objekt at lære fra data.
Med andre ord bruges .fit()
-metoden til træning af et objekt. Den tager parametrene X
og y
(y
er valgfri for opgaver med ikke-superviseret læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.
Transformer
En transformer har metoderne .fit()
og .transform()
, som på en eller anden måde transformerer dataene.
Normalt skal transformere lære noget fra data før de kan transformere, så du skal anvende .fit()
og derefter .transform()
. For at undgå dette har transformere også metoden .fit_transform()
.
.fit_transform()
giver samme resultat som at anvende .fit()
og .transform()
sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere bruges normalt til at transformere X
-arrayet. Som vi vil se i eksemplet med LabelEncoder
, er nogle transformere dog lavet til y
-arrayet.
nan
-værdier vist i træningssættet på billedet angiver manglende data i Python.
Predictor
En predictor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
bruges til at lave forudsigelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
En model er en type predictor, der også inkluderer metoden .score()
. Denne metode beregner en score (metrik) for at måle predictorens præstation.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nævnt i det forrige kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.
Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain the difference between a transformer and a predictor?
What are some common examples of transformers and predictors in scikit-learn?
How do I choose which scikit-learn object to use for my task?
Awesome!
Completion rate improved to 3.13
Scikit-learn Begreber
Stryg for at vise menuen
Biblioteket scikit-learn (importeret som sklearn
) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn
-objekter er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
betragtes som en estimator. Metoden .fit()
gør det muligt for et objekt at lære fra data.
Med andre ord bruges .fit()
-metoden til træning af et objekt. Den tager parametrene X
og y
(y
er valgfri for opgaver med ikke-superviseret læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.
Transformer
En transformer har metoderne .fit()
og .transform()
, som på en eller anden måde transformerer dataene.
Normalt skal transformere lære noget fra data før de kan transformere, så du skal anvende .fit()
og derefter .transform()
. For at undgå dette har transformere også metoden .fit_transform()
.
.fit_transform()
giver samme resultat som at anvende .fit()
og .transform()
sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere bruges normalt til at transformere X
-arrayet. Som vi vil se i eksemplet med LabelEncoder
, er nogle transformere dog lavet til y
-arrayet.
nan
-værdier vist i træningssættet på billedet angiver manglende data i Python.
Predictor
En predictor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
bruges til at lave forudsigelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
En model er en type predictor, der også inkluderer metoden .score()
. Denne metode beregner en score (metrik) for at måle predictorens præstation.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nævnt i det forrige kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.
Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.
Tak for dine kommentarer!