Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen BigQuery ML Modell-Durchlauf | Machine Learning in BigQuery
BigQuery Grundlagen

bookBigQuery ML Modell-Durchlauf

Swipe um das Menü anzuzeigen

Entdecken Sie den vollständigen Lebenszyklus eines Machine-Learning-Modells – von der Datenvorbereitung bis zur Interpretation der Ergebnisse für Stakeholder. Erstellen und bewerten Sie ein lineares Regressionsmodell direkt in BigQuery.

Datenvorbereitung und Schemadesign

Vor Beginn des Modellierens müssen Sie festlegen, wo die Daten gespeichert sind und wie sie strukturiert werden:

  • Schema erstellen: Spaltennamen und Datentypen definieren, um sicherzustellen, dass Daten korrekt geladen und abgefragt werden können;
  • Daten laden und inspizieren: Kleine Datensätze verwenden, um erste Korrelationen zu beobachten, beispielsweise wie die Anzahl der Schlafzimmer den Hauspreis beeinflusst;
  • Korrelationen verstehen: Mehrere Merkmale kombinieren, um starke prädiktive Zusammenhänge für reale Anwendungen zu identifizieren.

Modelltraining und Logik

Machine Learning bedeutet, einem Modell beizubringen, mathematische Zusammenhänge zwischen Eingaben und Ausgaben zu erkennen:

  • Modellauswahl: Lineare Regression verwenden, um kontinuierliche numerische Ergebnisse vorherzusagen;
  • Variablen definieren: Zielvariable (z. B. Preis) und Eingabemerkmale (z. B. Quadratmeterzahl und Schlafzimmer) festlegen;
  • Lernprozess: Das Training erfolgt in Iterationen, wobei das Modell sich anhand der Lernrate anpasst, um den Verlust (mittlere quadratische Abweichung) zu minimieren.

Bewertung und Validierung

Um sicherzustellen, dass Ihr Modell tatsächlich lernt und nicht nur auswendig lernt, müssen Sie seine Leistung validieren:

  • Trainings- und Evaluierungssplit: Etwa 20 Prozent der Daten zurückhalten, um das Modell an unbekannten Beispielen zu testen;
  • Modellevaluierungsmetriken: (R-Quadrat) verwenden, um die Vorhersagekraft zu messen – Werte über 0,8 deuten in der Regel auf eine solide Grundlage hin;
  • Werte vergleichen: Den prozentualen Fehler zwischen vorhergesagten und tatsächlichen Werten analysieren, um die Genauigkeit des Modells zu bestätigen.

Vorhersagen und Interpretation

Das Hauptziel ist es, aus neuen Daten umsetzbare Erkenntnisse zu gewinnen:

  • Vorhersagen generieren: Das trainierte Modell auf neue, unbekannte Datensätze anwenden, um reale Nutzung zu simulieren;
  • Gewichte interpretieren: Die Merkmalsgewichte analysieren, um zu bestimmen, welche Eingaben – wie die Anzahl der Schlafzimmer – den größten Einfluss auf die endgültige Vorhersage haben;
  • Basis-Intercepts: Den Achsenabschnitt identifizieren, um die Basisvorhersage zu verstehen, wenn alle Eingabemerkmale null sind.
question mark

Welche Reihenfolge stellt den Lebenszyklus beim Erstellen eines Machine-Learning-Modells in BigQuery, wie in diesem Kapitel beschrieben, am besten dar?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 3

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 6. Kapitel 3
some-alt