Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Modeller | Modellering
Introduktion till maskininlärning med Python

bookModeller

Grunderna i datapreprocessering och konstruktion av pipelines har nu behandlats. Nästa steg är modellering.

En modell i Scikit-learn är en estimator som tillhandahåller metoderna .predict() och .score(), samt .fit() som ärvs från alla estimatorer.

.fit()

När data är förbehandlad och redo att användas i modellen är det första steget i att bygga en modell träning av en modell. Detta görs med .fit(X, y).

Note
Notering

För övervakad inlärning (regression, klassificering) kräver .fit() både X och y. För oövervakad inlärning (t.ex. klustring) anropas endast .fit(X). Att skicka med y orsakar inget fel — det ignoreras helt enkelt.

Under träning lär sig modellen mönster som behövs för prediktion. Vad modellen lär sig och hur lång tid träningen tar beror på algoritmen. Träning är ofta den långsammaste delen av maskininlärning, särskilt med stora datamängder.

.predict()

Efter träning används .predict() för att generera prediktioner:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() utvärderar en tränad modell, vanligtvis på en testuppsättning:

model.fit(X, y)
model.score(X_test, y_test)

Den jämför förutsägelser med verkliga mål. Som standard är måttet noggrannhet för klassificering.

Note
Notering

X_test avser den delmängd av datamängden, känd som testuppsättningen, som används för att utvärdera en modells prestanda efter träning. Den innehåller funktionerna (inmatningsdata). y_test är motsvarande delmängd av sanna etiketter för X_test. Tillsammans bedömer de hur väl modellen förutsäger ny, osedd data.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 1

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

bookModeller

Svep för att visa menyn

Grunderna i datapreprocessering och konstruktion av pipelines har nu behandlats. Nästa steg är modellering.

En modell i Scikit-learn är en estimator som tillhandahåller metoderna .predict() och .score(), samt .fit() som ärvs från alla estimatorer.

.fit()

När data är förbehandlad och redo att användas i modellen är det första steget i att bygga en modell träning av en modell. Detta görs med .fit(X, y).

Note
Notering

För övervakad inlärning (regression, klassificering) kräver .fit() både X och y. För oövervakad inlärning (t.ex. klustring) anropas endast .fit(X). Att skicka med y orsakar inget fel — det ignoreras helt enkelt.

Under träning lär sig modellen mönster som behövs för prediktion. Vad modellen lär sig och hur lång tid träningen tar beror på algoritmen. Träning är ofta den långsammaste delen av maskininlärning, särskilt med stora datamängder.

.predict()

Efter träning används .predict() för att generera prediktioner:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() utvärderar en tränad modell, vanligtvis på en testuppsättning:

model.fit(X, y)
model.score(X_test, y_test)

Den jämför förutsägelser med verkliga mål. Som standard är måttet noggrannhet för klassificering.

Note
Notering

X_test avser den delmängd av datamängden, känd som testuppsättningen, som används för att utvärdera en modells prestanda efter träning. Den innehåller funktionerna (inmatningsdata). y_test är motsvarande delmängd av sanna etiketter för X_test. Tillsammans bedömer de hur väl modellen förutsäger ny, osedd data.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 1
some-alt