Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Scikit-learn-Koncept | Förbehandling av Data med Scikit-learn
ML-introduktion Med Scikit-learn

bookScikit-learn-Koncept

Biblioteket scikit-learn (importerat som sklearn) erbjuder olika funktioner och klasser för förbehandling av data och modellering. De huvudsakliga objekten i sklearn är estimator, transformer, predictor och model.

Estimator

Varje klass i sklearn med metoden .fit() betraktas som en estimator. Metoden .fit() gör det möjligt för ett objekt att lära sig från data.

Med andra ord används metoden .fit() för träning av ett objekt. Den tar parametrarna X och y (y är valfri för uppgifter inom oövervakad inlärning).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det är inte särskilt användbart om ett objekt endast lär sig från data utan att producera något resultat. Mer praktiska är de två typer av objekt som ärver från estimator: transformer och predictor.

Transformer

En transformer har metoderna .fit() och .transform() som transformerar data på något sätt.

Vanligtvis behöver transformers lära sig något från data innan de kan transformera den, så du behöver använda .fit() och sedan .transform(). För att undvika detta finns även metoden .fit_transform().
.fit_transform() ger samma resultat som att använda .fit() och .transform() sekventiellt, men är ibland snabbare och därför att föredra framför .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Notera

Transformers används vanligtvis för att transformera X-arrayen. Men som vi kommer att se i exemplet med LabelEncoder, är vissa transformers avsedda för y-arrayen.

nan-värden som visas i träningsuppsättningen på bilden indikerar saknade data i Python.

Prediktor

En prediktor är en estimator (har metoden .fit()) som även har metoden .predict(). Metoden .predict() används för att göra förutsägelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modell

En modell är en typ av prediktor som även inkluderar metoden .score(). Denna metod beräknar ett värde (metrik) för att mäta prediktorns prestanda.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nämnts i föregående kapitel är noggrannhet en metrik som representerar andelen korrekta förutsägelser.

Förbehandlingssteget innebär arbete med transformatorer, och vi arbetar med prediktorer (mer specifikt med modeller) i modelleringssteget.

question mark

Välj alla korrekta påståenden.

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 1

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Awesome!

Completion rate improved to 3.13

bookScikit-learn-Koncept

Svep för att visa menyn

Biblioteket scikit-learn (importerat som sklearn) erbjuder olika funktioner och klasser för förbehandling av data och modellering. De huvudsakliga objekten i sklearn är estimator, transformer, predictor och model.

Estimator

Varje klass i sklearn med metoden .fit() betraktas som en estimator. Metoden .fit() gör det möjligt för ett objekt att lära sig från data.

Med andra ord används metoden .fit() för träning av ett objekt. Den tar parametrarna X och y (y är valfri för uppgifter inom oövervakad inlärning).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det är inte särskilt användbart om ett objekt endast lär sig från data utan att producera något resultat. Mer praktiska är de två typer av objekt som ärver från estimator: transformer och predictor.

Transformer

En transformer har metoderna .fit() och .transform() som transformerar data på något sätt.

Vanligtvis behöver transformers lära sig något från data innan de kan transformera den, så du behöver använda .fit() och sedan .transform(). För att undvika detta finns även metoden .fit_transform().
.fit_transform() ger samma resultat som att använda .fit() och .transform() sekventiellt, men är ibland snabbare och därför att föredra framför .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Notera

Transformers används vanligtvis för att transformera X-arrayen. Men som vi kommer att se i exemplet med LabelEncoder, är vissa transformers avsedda för y-arrayen.

nan-värden som visas i träningsuppsättningen på bilden indikerar saknade data i Python.

Prediktor

En prediktor är en estimator (har metoden .fit()) som även har metoden .predict(). Metoden .predict() används för att göra förutsägelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modell

En modell är en typ av prediktor som även inkluderar metoden .score(). Denna metod beräknar ett värde (metrik) för att mäta prediktorns prestanda.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nämnts i föregående kapitel är noggrannhet en metrik som representerar andelen korrekta förutsägelser.

Förbehandlingssteget innebär arbete med transformatorer, och vi arbetar med prediktorer (mer specifikt med modeller) i modelleringssteget.

question mark

Välj alla korrekta påståenden.

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 1
some-alt