Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Datatyper | Maskinlæringskonsepter
ML-Introduksjon med Scikit-learn

bookDatatyper

Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.

De fleste ML-algoritmer fungerer godt kun med numeriske data, så kategoriske og dato-/tid-verdier må konverteres til tall.

For dato og tid kan funksjoner som 'year', 'month' og lignende trekkes ut, avhengig av oppgaven. Disse er allerede numeriske verdier, så de kan brukes direkte.

Kategoriske data er litt mer utfordrende å håndtere.

Typer av kategoriske data

Kategoriske data deles inn i to typer:

  • Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.;

  • Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.

Konvertering av ordinale og nominale datatyper til numeriske verdier krever ulike tilnærminger, så de må behandles separat.

Note
Les mer

Det finnes bedre måter å konvertere datoer til numeriske verdier på, som ligger utenfor rammen for dette introduksjonskurset. For eksempel, hvis vi kun bruker 'month'-funksjonen, tar det ikke hensyn til at 12. måned faktisk er nærmere 1. enn 9..

question-icon

Koble egenskapen til riktig datatype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how to convert ordinal data into numerical values?

What are the common methods for encoding nominal data?

Why do machine learning algorithms require numerical data?

Awesome!

Completion rate improved to 3.13

bookDatatyper

Sveip for å vise menyen

Hver kolonne (funksjon) i et treningssett har en tilknyttet datatype. Disse datatypene kan grupperes i numeriske, kategoriske og dato og/eller tid.

De fleste ML-algoritmer fungerer godt kun med numeriske data, så kategoriske og dato-/tid-verdier må konverteres til tall.

For dato og tid kan funksjoner som 'year', 'month' og lignende trekkes ut, avhengig av oppgaven. Disse er allerede numeriske verdier, så de kan brukes direkte.

Kategoriske data er litt mer utfordrende å håndtere.

Typer av kategoriske data

Kategoriske data deles inn i to typer:

  • Ordinal data er en type kategoriske data der kategoriene følger en naturlig rekkefølge. For eksempel utdanningsnivå (fra barneskole til Ph.D.) eller vurderinger (fra svært dårlig til svært bra), osv.;

  • Nominale data er en type kategoriske data som ikke følger noen naturlig rekkefølge. For eksempel navn, kjønn, opprinnelsesland, osv.

Konvertering av ordinale og nominale datatyper til numeriske verdier krever ulike tilnærminger, så de må behandles separat.

Note
Les mer

Det finnes bedre måter å konvertere datoer til numeriske verdier på, som ligger utenfor rammen for dette introduksjonskurset. For eksempel, hvis vi kun bruker 'month'-funksjonen, tar det ikke hensyn til at 12. måned faktisk er nærmere 1. enn 9..

question-icon

Koble egenskapen til riktig datatype.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 4
some-alt