Scikit-learn-Koncept
Biblioteket scikit-learn (importerat som sklearn
) erbjuder olika funktioner och klasser för förbehandling av data och modellering. De huvudsakliga objekten i sklearn
är estimator, transformer, predictor och model.
Estimator
Varje klass i sklearn
med metoden .fit()
betraktas som en estimator. Metoden .fit()
gör det möjligt för ett objekt att lära sig från data.
Med andra ord används metoden .fit()
för träning av ett objekt. Den tar parametrarna X
och y
(y
är valfri för uppgifter inom oövervakad inlärning).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det är inte särskilt användbart om ett objekt endast lär sig från data utan att producera något resultat. Mer praktiska är de två typer av objekt som ärver från estimator: transformer och predictor.
Transformer
En transformer har metoderna .fit()
och .transform()
som transformerar data på något sätt.
Vanligtvis behöver transformers lära sig något från data innan de kan transformera den, så du behöver använda .fit()
och sedan .transform()
. För att undvika detta finns även metoden .fit_transform()
.
.fit_transform()
ger samma resultat som att använda .fit()
och .transform()
sekventiellt, men är ibland snabbare och därför att föredra framför .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformers används vanligtvis för att transformera X
-arrayen. Men som vi kommer att se i exemplet med LabelEncoder
, är vissa transformers avsedda för y
-arrayen.
nan
-värden som visas i träningsuppsättningen på bilden indikerar saknade data i Python.
Prediktor
En prediktor är en estimator (har metoden .fit()
) som även har metoden .predict()
. Metoden .predict()
används för att göra förutsägelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modell
En modell är en typ av prediktor som även inkluderar metoden .score()
. Denna metod beräknar ett värde (metrik) för att mäta prediktorns prestanda.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nämnts i föregående kapitel är noggrannhet en metrik som representerar andelen korrekta förutsägelser.
Förbehandlingssteget innebär arbete med transformatorer, och vi arbetar med prediktorer (mer specifikt med modeller) i modelleringssteget.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.13
Scikit-learn-Koncept
Svep för att visa menyn
Biblioteket scikit-learn (importerat som sklearn
) erbjuder olika funktioner och klasser för förbehandling av data och modellering. De huvudsakliga objekten i sklearn
är estimator, transformer, predictor och model.
Estimator
Varje klass i sklearn
med metoden .fit()
betraktas som en estimator. Metoden .fit()
gör det möjligt för ett objekt att lära sig från data.
Med andra ord används metoden .fit()
för träning av ett objekt. Den tar parametrarna X
och y
(y
är valfri för uppgifter inom oövervakad inlärning).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det är inte särskilt användbart om ett objekt endast lär sig från data utan att producera något resultat. Mer praktiska är de två typer av objekt som ärver från estimator: transformer och predictor.
Transformer
En transformer har metoderna .fit()
och .transform()
som transformerar data på något sätt.
Vanligtvis behöver transformers lära sig något från data innan de kan transformera den, så du behöver använda .fit()
och sedan .transform()
. För att undvika detta finns även metoden .fit_transform()
.
.fit_transform()
ger samma resultat som att använda .fit()
och .transform()
sekventiellt, men är ibland snabbare och därför att föredra framför .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformers används vanligtvis för att transformera X
-arrayen. Men som vi kommer att se i exemplet med LabelEncoder
, är vissa transformers avsedda för y
-arrayen.
nan
-värden som visas i träningsuppsättningen på bilden indikerar saknade data i Python.
Prediktor
En prediktor är en estimator (har metoden .fit()
) som även har metoden .predict()
. Metoden .predict()
används för att göra förutsägelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modell
En modell är en typ av prediktor som även inkluderar metoden .score()
. Denna metod beräknar ett värde (metrik) för att mäta prediktorns prestanda.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nämnts i föregående kapitel är noggrannhet en metrik som representerar andelen korrekta förutsägelser.
Förbehandlingssteget innebär arbete med transformatorer, och vi arbetar med prediktorer (mer specifikt med modeller) i modelleringssteget.
Tack för dina kommentarer!