BigQuery ML Modell-Durchlauf
Swipe um das Menü anzuzeigen
Entdecken Sie den vollständigen Lebenszyklus eines Machine-Learning-Modells – von der Datenvorbereitung bis zur Interpretation der Ergebnisse für Stakeholder. Erstellen und bewerten Sie ein lineares Regressionsmodell direkt in BigQuery.
Datenvorbereitung und Schemadesign
Vor Beginn des Modellierens müssen Sie festlegen, wo die Daten gespeichert sind und wie sie strukturiert werden:
- Schema erstellen: Spaltennamen und Datentypen definieren, um sicherzustellen, dass Daten korrekt geladen und abgefragt werden können;
- Daten laden und inspizieren: Kleine Datensätze verwenden, um erste Korrelationen zu beobachten, beispielsweise wie die Anzahl der Schlafzimmer den Hauspreis beeinflusst;
- Korrelationen verstehen: Mehrere Merkmale kombinieren, um starke prädiktive Zusammenhänge für reale Anwendungen zu identifizieren.
Modelltraining und Logik
Machine Learning bedeutet, einem Modell beizubringen, mathematische Zusammenhänge zwischen Eingaben und Ausgaben zu erkennen:
- Modellauswahl: Lineare Regression verwenden, um kontinuierliche numerische Ergebnisse vorherzusagen;
- Variablen definieren: Zielvariable (z. B. Preis) und Eingabemerkmale (z. B. Quadratmeterzahl und Schlafzimmer) festlegen;
- Lernprozess: Das Training erfolgt in Iterationen, wobei das Modell sich anhand der Lernrate anpasst, um den Verlust (mittlere quadratische Abweichung) zu minimieren.
Bewertung und Validierung
Um sicherzustellen, dass Ihr Modell tatsächlich lernt und nicht nur auswendig lernt, müssen Sie seine Leistung validieren:
- Trainings- und Evaluierungssplit: Etwa 20 Prozent der Daten zurückhalten, um das Modell an unbekannten Beispielen zu testen;
- Modellevaluierungsmetriken: (R-Quadrat) verwenden, um die Vorhersagekraft zu messen – Werte über 0,8 deuten in der Regel auf eine solide Grundlage hin;
- Werte vergleichen: Den prozentualen Fehler zwischen vorhergesagten und tatsächlichen Werten analysieren, um die Genauigkeit des Modells zu bestätigen.
Vorhersagen und Interpretation
Das Hauptziel ist es, aus neuen Daten umsetzbare Erkenntnisse zu gewinnen:
- Vorhersagen generieren: Das trainierte Modell auf neue, unbekannte Datensätze anwenden, um reale Nutzung zu simulieren;
- Gewichte interpretieren: Die Merkmalsgewichte analysieren, um zu bestimmen, welche Eingaben – wie die Anzahl der Schlafzimmer – den größten Einfluss auf die endgültige Vorhersage haben;
- Basis-Intercepts: Den Achsenabschnitt identifizieren, um die Basisvorhersage zu verstehen, wenn alle Eingabemerkmale null sind.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen