Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære BigQuery ML-Modelgennemgang | Maskinlæring i BigQuery
BigQuery Grundlæggende

bookBigQuery ML-Modelgennemgang

Stryg for at vise menuen

Opdag hele livscyklussen for en maskinlæringsmodel, fra dataklargøring til fortolkning af resultater for interessenter. Byg og evaluer en lineær regressionsmodel direkte i BigQuery.

Dataklargøring og skemadesign

Før modelleringen begynder, skal du definere, hvor dataene findes, og hvordan de er struktureret:

  • Oprettelse af skema: definer kolonnenavne og datatyper for at sikre, at data kan indlæses og forespørges korrekt;
  • Indlæsning og inspektion af data: brug små datasæt til at observere indledende korrelationer, såsom hvordan antallet af soveværelser påvirker huspriser;
  • Forståelse af korrelationer: kombiner flere egenskaber for at afdække stærke prædiktive sammenhænge, der er nødvendige for virkelige anvendelser.

Modellering og logik

Maskinlæring indebærer at lære en model at genkende matematiske sammenhænge mellem input og output:

  • Modelvalg: anvend lineær regression til at forudsige kontinuerlige numeriske resultater;
  • Definition af variable: angiv målvariabel (f.eks. pris) og inputegenskaber (f.eks. kvadratmeter og antal soveværelser);
  • Læringsprocessen: træning foregår i iterationer, hvor modellen justerer sig baseret på læringsraten for at minimere tab (middel kvadreret fejl).

Evaluering og validering

For at sikre, at din model reelt lærer og ikke blot husker, skal du validere dens ydeevne:

  • Opdeling i trænings- og evalueringssæt: tilbagehold cirka 20 procent af dine data for at teste modellen på ukendte eksempler;
  • Model evalueringsmetrikker: brug (R-squared) til at måle prædiktiv styrke, hvor værdier over 0,8 typisk indikerer et solidt grundlag;
  • Sammenligning af værdier: analyser procentfejlen mellem forudsagte og faktiske værdier for at bekræfte modellens nøjagtighed.

Forudsigelser og fortolkning

Det ultimative mål er at generere handlingsorienteret indsigt fra nye data:

  • Generering af forudsigelser: anvend den trænede model på nye, ukendte poster for at simulere reel brug;
  • Fortolkning af vægte: undersøg egenskabsvægte for at afgøre, hvilke input, såsom antal soveværelser, der har størst indflydelse på den endelige forudsigelse;
  • Basisintercept: identificer interceptet for at forstå basisforudsigelsen, når alle inputegenskaber er nul.
question mark

Hvilken rækkefølge repræsenterer bedst livscyklussen for opbygning af en maskinlæringsmodel i BigQuery som beskrevet i dette kapitel

Vælg det korrekte svar

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 6. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 6. Kapitel 3
some-alt