Treningssett
I overvåket eller ikke-overvåket læring presenteres treningssettet vanligvis i tabellformat.
Et eksempel er diabetesdatasettet, som brukes til å forutsi om en person har diabetes. Det inneholder oppføringer for 768 kvinner med parametere som alder, kroppsmasseindeks og blodtrykk. Disse parameterne kalles egenskaper.
Datasettet inkluderer også en 'Outcome'
-kolonne som indikerer om personen har diabetes. Dette er målvariabelen.
Hver rad i tabellen er en forekomst (også kalt et datapunkt eller en prøve), som representerer informasjon om én enkelt person.
Tabellen (treningssettet) har en målkolonne, noe som betyr at den er merket.
Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på egenskaper.
Dette treningssettet er et eksempel på et skjevt datasett, da det utelukkende inneholder informasjon om kvinner som er minst 21 år gamle. Derfor kan modellen gi mindre nøyaktige prediksjoner for menn eller for kvinner under 21 år, siden den ikke er trent på disse gruppene.
Ved koding blir funksjonskolonner vanligvis tilordnet til X
og målkolonner tilordnet som y
.
Og funksjoner for nye instanser tilordnes som X_new
.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
What is the difference between features and the target variable?
Can you explain what X, y, and X_new represent in machine learning?
How does the model use X_new to make predictions?
Awesome!
Completion rate improved to 3.13
Treningssett
Sveip for å vise menyen
I overvåket eller ikke-overvåket læring presenteres treningssettet vanligvis i tabellformat.
Et eksempel er diabetesdatasettet, som brukes til å forutsi om en person har diabetes. Det inneholder oppføringer for 768 kvinner med parametere som alder, kroppsmasseindeks og blodtrykk. Disse parameterne kalles egenskaper.
Datasettet inkluderer også en 'Outcome'
-kolonne som indikerer om personen har diabetes. Dette er målvariabelen.
Hver rad i tabellen er en forekomst (også kalt et datapunkt eller en prøve), som representerer informasjon om én enkelt person.
Tabellen (treningssettet) har en målkolonne, noe som betyr at den er merket.
Oppgaven er å trene ML-modellen på dette treningssettet, og når den er trent, kan den forutsi for andre personer (nye forekomster) om de har diabetes basert kun på egenskaper.
Dette treningssettet er et eksempel på et skjevt datasett, da det utelukkende inneholder informasjon om kvinner som er minst 21 år gamle. Derfor kan modellen gi mindre nøyaktige prediksjoner for menn eller for kvinner under 21 år, siden den ikke er trent på disse gruppene.
Ved koding blir funksjonskolonner vanligvis tilordnet til X
og målkolonner tilordnet som y
.
Og funksjoner for nye instanser tilordnes som X_new
.
Takk for tilbakemeldingene dine!