Swipe um das Menü anzuzeigen

Entdecken Sie BigQuery Machine Learning (BigQuery ML), eine Funktion, mit der Sie Machine-Learning-Modelle direkt in der BigQuery-Oberfläche mithilfe von SQL erstellen und bereitstellen können. Es ist nicht erforderlich, Python oder externe ML-Frameworks zu verwenden, um prädiktive und Clustering-Modelle auszuführen, ohne die Data-Warehouse-Umgebung zu verlassen.

BigQuery ML stellt einen bedeutenden Fortschritt bei der Vereinfachung des Zugriffs auf Machine-Learning-Funktionen dar, indem es Skalierbarkeit, Benutzerfreundlichkeit und nahtlose Datenintegration kombiniert.

Kein Python erforderlich

BigQuery ML ermöglicht das Erstellen, Trainieren und Bewerten von Modellen mit reiner SQL-Syntax. Dadurch entfällt die Komplexität, zusätzliche Programmiersprachen zu erlernen, und jeder, der mit SQL vertraut ist, kann sich an prädiktiven Analysen und Data-Science-Workflows beteiligen.

Beispiel:

CREATE MODEL `project.dataset.model_name`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.table;

Daten verlassen BigQuery nie

Alle Berechnungen erfolgen innerhalb der BigQuery-Umgebung. Daten müssen nicht exportiert oder in ein anderes Tool importiert werden. Dies gewährleistet sowohl Datensicherheit als auch Effizienz und vermeidet unnötige Infrastruktur oder externe Abhängigkeiten.

Vollständig serverlos und verwaltet

BigQuery ML ist serverlos – das bedeutet, dass Google die Infrastruktur, Skalierbarkeit und Ressourcenverteilung automatisch übernimmt. Es ist nicht erforderlich, zusätzliche Server bereitzustellen oder Umgebungen zu verwalten.

Vorteile

Benutzerfreundlichkeit: erfordert nur SQL-Kenntnisse zum Einstieg;
Datenlokalität: Modelle werden direkt auf den bereits in BigQuery vorhandenen Daten trainiert;
Kein Infrastruktur-Overhead: keine separaten ML-Umgebungen oder Compute-Cluster erforderlich;
Schnellere Erkenntnisse: Modelle können in Minuten statt Tagen erstellt, trainiert und bewertet werden.

Zentrale Funktionen

`CREATE MODEL`

Definiert und trainiert ein Modell. Beispiel:

CREATE MODEL `dataset.sales_forecast`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.sales_data;

`EVALUATE`

Misst die Modellgüte anhand von Metriken wie R-Quadrat, RMSE und Fehlermarge. Das Verständnis dieser Metriken stellt sicher, dass Modelle statistisch valide und zuverlässig sind.

`PREDICT`

Erzeugt Vorhersagen mit dem trainierten Modell. Typischerweise werden 80 % der Daten für das Training und 20 % für das Testen verwendet, um eine ausgewogene Leistung sicherzustellen.

`EXPLAIN`

Interpretiert das Modell, indem identifiziert wird, welche Merkmale das vorhergesagte Ergebnis am stärksten beeinflussen. Dies hilft, Overfitting (zu viele irrelevante Merkmale) zu erkennen und die Interpretierbarkeit zu gewährleisten.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 1

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Einführung in BigQuery ML