Scikit-learn-Konsepter
Biblioteket scikit-learn (importert som sklearn
) tilbyr ulike funksjoner og klasser for forhåndsprosessering av data og modellering. De viktigste sklearn
-objektene er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
regnes som en estimator. Metoden .fit()
gjør det mulig for et objekt å lære fra data.
Med andre ord brukes .fit()
-metoden til å trene et objekt. Den tar parameterne X
og y
(y
er valgfri for oppgaver innen usupervisert læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttig om et objekt kun lærer fra data uten å produsere noe resultat. Mer praktiske er de to typene objekter som arver fra estimator: transformer og predictor.
Transformer
En transformer har metodene .fit()
og .transform()
som transformerer dataene på en eller annen måte.
Vanligvis må transformere lære noe fra dataene før de kan transformere, så du må bruke .fit()
og deretter .transform()
. For å forenkle dette, har transformere også metoden .fit_transform()
.
.fit_transform()
gir samme resultat som å bruke .fit()
og deretter .transform()
sekvensielt, men er noen ganger raskere, så det er å foretrekke fremfor .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere brukes vanligvis til å transformere X
-arrayet. Men som vi skal se i eksempelet med LabelEncoder
, er noen transformere laget for y
-arrayet.
nan
-verdier vist i treningssettet på bildet indikerer manglende data i Python.
Prediktor
En prediktor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
brukes til å gjøre prediksjoner.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modell
En modell er en type prediktor som også inkluderer metoden .score()
. Denne metoden beregner en score (metrikker) for å måle prediktorens ytelse.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nevnt i forrige kapittel, er nøyaktighet en metrikk som representerer prosentandelen korrekte prediksjoner.
Forbehandlingsstadiet innebærer arbeid med transformatorer, og vi arbeider med prediktorer (mer spesifikt med modeller) i modelleringsstadiet.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
Scikit-learn-Konsepter
Sveip for å vise menyen
Biblioteket scikit-learn (importert som sklearn
) tilbyr ulike funksjoner og klasser for forhåndsprosessering av data og modellering. De viktigste sklearn
-objektene er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
regnes som en estimator. Metoden .fit()
gjør det mulig for et objekt å lære fra data.
Med andre ord brukes .fit()
-metoden til å trene et objekt. Den tar parameterne X
og y
(y
er valgfri for oppgaver innen usupervisert læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttig om et objekt kun lærer fra data uten å produsere noe resultat. Mer praktiske er de to typene objekter som arver fra estimator: transformer og predictor.
Transformer
En transformer har metodene .fit()
og .transform()
som transformerer dataene på en eller annen måte.
Vanligvis må transformere lære noe fra dataene før de kan transformere, så du må bruke .fit()
og deretter .transform()
. For å forenkle dette, har transformere også metoden .fit_transform()
.
.fit_transform()
gir samme resultat som å bruke .fit()
og deretter .transform()
sekvensielt, men er noen ganger raskere, så det er å foretrekke fremfor .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere brukes vanligvis til å transformere X
-arrayet. Men som vi skal se i eksempelet med LabelEncoder
, er noen transformere laget for y
-arrayet.
nan
-verdier vist i treningssettet på bildet indikerer manglende data i Python.
Prediktor
En prediktor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
brukes til å gjøre prediksjoner.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modell
En modell er en type prediktor som også inkluderer metoden .score()
. Denne metoden beregner en score (metrikker) for å måle prediktorens ytelse.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nevnt i forrige kapittel, er nøyaktighet en metrikk som representerer prosentandelen korrekte prediksjoner.
Forbehandlingsstadiet innebærer arbeid med transformatorer, og vi arbeider med prediktorer (mer spesifikt med modeller) i modelleringsstadiet.
Takk for tilbakemeldingene dine!