Leer BigQuery ML-Model Walkthrough | Machine Learning in BigQuery

Veeg om het menu te tonen

Ontdek de volledige levenscyclus van een machine learning-model, van gegevensvoorbereiding tot het interpreteren van resultaten voor belanghebbenden. Bouw en evalueer een lineair regressiemodel direct binnen BigQuery.

Gegevensvoorbereiding en Schemaontwerp

Voordat het modelleren begint, moet u bepalen waar de gegevens zich bevinden en hoe deze zijn gestructureerd:

Een schema maken: kolomnamen en gegevenstypen definiëren om te waarborgen dat gegevens correct kunnen worden geladen en bevraagd;
Gegevens laden en inspecteren: gebruik kleine datasets om initiële correlaties te observeren, zoals hoe het aantal slaapkamers de huizenprijzen beïnvloedt;
Correlaties begrijpen: meerdere kenmerken combineren om sterke voorspellende relaties te ontdekken die nodig zijn voor toepassingen in de praktijk.

Modeltraining en Logica

Machine learning houdt in dat een model wordt geleerd wiskundige relaties tussen invoer en uitvoer te herkennen:

Modelselectie: lineaire regressie gebruiken voor het voorspellen van continue numerieke uitkomsten;
Variabelen definiëren: de doelvariabele instellen (bijvoorbeeld prijs) en invoerkenmerken (bijvoorbeeld oppervlakte en aantal slaapkamers);
Het leerproces: training vindt plaats in iteraties waarbij het model zich aanpast op basis van het leerpercentage om het verlies (mean squared error) te minimaliseren.

Evaluatie en Validatie

Om te waarborgen dat uw model daadwerkelijk leert in plaats van onthoudt, moet u de prestaties valideren:

Train- en evaluatiesplitsing: houd ongeveer 20 procent van uw gegevens achter om het model te testen op niet eerder geziene voorbeelden;
Model evaluatiemaatstaven: gebruik (R-kwadraat) om het voorspellend vermogen te meten, waarbij waarden boven 0,8 doorgaans een solide basis aangeven;
Waarden vergelijken: analyseer het procentuele verschil tussen voorspelde en werkelijke waarden om de nauwkeurigheid van het model te bevestigen.

Voorspellingen Maken en Interpretatie

Het uiteindelijke doel is om bruikbare inzichten te genereren uit nieuwe gegevens:

Voorspellingen genereren: pas het getrainde model toe op nieuwe, niet eerder geziene records om gebruik in de praktijk te simuleren;
Gewichten interpreteren: bekijk kenmerkgewichten om te bepalen welke invoer, zoals het aantal slaapkamers, de grootste invloed heeft op de uiteindelijke voorspelling;
Basisintercepten: identificeer het intercept om de basisvoorspelling te begrijpen wanneer alle invoerkenmerken nul zijn.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 6. Hoofdstuk 3

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 6. Hoofdstuk 3