Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Träningsmängd | Maskininlärningskoncept
ML-introduktion Med Scikit-learn

bookTräningsmängd

Vid övervakad eller oövervakad inlärning presenteras träningsuppsättningen vanligtvis i tabellformat.

Ett exempel är diabetesdatasetet, som används för att förutsäga om en person har diabetes. Det innehåller poster om 768 kvinnor med parametrar såsom ålder, kroppsmassaindex och blodtryck. Dessa parametrar kallas funktioner.

Datasetet innehåller även en 'Outcome'-kolumn som anger om personen har diabetes. Detta är den målvariabel.

Varje rad i tabellen är en instans (även kallad datapunkt eller prov), som representerar information om en enskild individ.

Tabellen (träningsuppsättningen) har en målkolumn, vilket innebär att den är märkt.

Uppgiften är att träna ML-modellen på denna träningsuppsättning, och när den är tränad kan den förutsäga för andra personer (nya instanser) om de har diabetes baserat enbart på funktionerna.

Note
Notera

Denna träningsuppsättning är ett exempel på ett partiskt dataset eftersom det uteslutande innehåller information om kvinnor som är minst 21 år gamla. Därför kan modellen ge mindre exakta förutsägelser för män eller för kvinnor under 21, eftersom den inte har tränats på dessa grupper.

Vid kodning tilldelas funktionskolumner vanligtvis till X och målkolumner tilldelas som y.

Och egenskaper för nya instanser tilldelas som X_new.

question-icon

Matcha variabelnamnen med den data de vanligtvis innehåller.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 3

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Awesome!

Completion rate improved to 3.13

bookTräningsmängd

Svep för att visa menyn

Vid övervakad eller oövervakad inlärning presenteras träningsuppsättningen vanligtvis i tabellformat.

Ett exempel är diabetesdatasetet, som används för att förutsäga om en person har diabetes. Det innehåller poster om 768 kvinnor med parametrar såsom ålder, kroppsmassaindex och blodtryck. Dessa parametrar kallas funktioner.

Datasetet innehåller även en 'Outcome'-kolumn som anger om personen har diabetes. Detta är den målvariabel.

Varje rad i tabellen är en instans (även kallad datapunkt eller prov), som representerar information om en enskild individ.

Tabellen (träningsuppsättningen) har en målkolumn, vilket innebär att den är märkt.

Uppgiften är att träna ML-modellen på denna träningsuppsättning, och när den är tränad kan den förutsäga för andra personer (nya instanser) om de har diabetes baserat enbart på funktionerna.

Note
Notera

Denna träningsuppsättning är ett exempel på ett partiskt dataset eftersom det uteslutande innehåller information om kvinnor som är minst 21 år gamla. Därför kan modellen ge mindre exakta förutsägelser för män eller för kvinnor under 21, eftersom den inte har tränats på dessa grupper.

Vid kodning tilldelas funktionskolumner vanligtvis till X och målkolumner tilldelas som y.

Och egenskaper för nya instanser tilldelas som X_new.

question-icon

Matcha variabelnamnen med den data de vanligtvis innehåller.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 3
some-alt