Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Einführung in BigQuery ML | Machine Learning in BigQuery
BigQuery Grundlagen

bookEinführung in BigQuery ML

Swipe um das Menü anzuzeigen

Entdecken Sie BigQuery Machine Learning (BigQuery ML), eine Funktion, mit der Sie Machine-Learning-Modelle direkt in der BigQuery-Oberfläche mithilfe von SQL erstellen und bereitstellen können. Es ist nicht erforderlich, Python oder externe ML-Frameworks zu verwenden, um prädiktive und Clustering-Modelle auszuführen, ohne die Data-Warehouse-Umgebung zu verlassen.

BigQuery ML stellt einen bedeutenden Fortschritt bei der Vereinfachung des Zugriffs auf Machine-Learning-Funktionen dar, indem es Skalierbarkeit, Benutzerfreundlichkeit und nahtlose Datenintegration kombiniert.

Kein Python erforderlich

BigQuery ML ermöglicht das Erstellen, Trainieren und Bewerten von Modellen mit reiner SQL-Syntax. Dadurch entfällt die Komplexität, zusätzliche Programmiersprachen zu erlernen, und jeder, der mit SQL vertraut ist, kann sich an prädiktiven Analysen und Data-Science-Workflows beteiligen.

Beispiel:

CREATE MODEL `project.dataset.model_name`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.table;

Daten verlassen BigQuery nie

Alle Berechnungen erfolgen innerhalb der BigQuery-Umgebung. Daten müssen nicht exportiert oder in ein anderes Tool importiert werden. Dies gewährleistet sowohl Datensicherheit als auch Effizienz und vermeidet unnötige Infrastruktur oder externe Abhängigkeiten.

Vollständig serverlos und verwaltet

BigQuery ML ist serverlos – das bedeutet, dass Google die Infrastruktur, Skalierbarkeit und Ressourcenverteilung automatisch übernimmt. Es ist nicht erforderlich, zusätzliche Server bereitzustellen oder Umgebungen zu verwalten.

Vorteile

  • Benutzerfreundlichkeit: erfordert nur SQL-Kenntnisse zum Einstieg;
  • Datenlokalität: Modelle werden direkt auf den bereits in BigQuery vorhandenen Daten trainiert;
  • Kein Infrastruktur-Overhead: keine separaten ML-Umgebungen oder Compute-Cluster erforderlich;
  • Schnellere Erkenntnisse: Modelle können in Minuten statt Tagen erstellt, trainiert und bewertet werden.

Zentrale Funktionen

CREATE MODEL

Definiert und trainiert ein Modell. Beispiel:

CREATE MODEL `dataset.sales_forecast`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.sales_data;

EVALUATE

Misst die Modellgüte anhand von Metriken wie R-Quadrat, RMSE und Fehlermarge. Das Verständnis dieser Metriken stellt sicher, dass Modelle statistisch valide und zuverlässig sind.

PREDICT

Erzeugt Vorhersagen mit dem trainierten Modell. Typischerweise werden 80 % der Daten für das Training und 20 % für das Testen verwendet, um eine ausgewogene Leistung sicherzustellen.

EXPLAIN

Interpretiert das Modell, indem identifiziert wird, welche Merkmale das vorhergesagte Ergebnis am stärksten beeinflussen. Dies hilft, Overfitting (zu viele irrelevante Merkmale) zu erkennen und die Interpretierbarkeit zu gewährleisten.

question mark

Welche Aussagen beschreiben die Kernfunktionen oder Vorteile von BigQuery ML zutreffend?

Wählen Sie alle richtigen Antworten aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 1

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 6. Kapitel 1
some-alt