Summary  
This chapter explains how to manage very large tables in SQL by using table sampling to query a random subset of rows and by creating external table connections to data stored in cloud storage without full import.  

General domain of usage  
Data analytics

Erfahren Sie, wie Sie mit **sehr großen Tabellen in BigQuery** arbeiten, ohne übermäßige Kosten oder Leistungseinbußen zu riskieren. Entdecken Sie **Tabellen-Sampling** und **externe Datenverbindungen** – zwei Techniken, mit denen sich große Datensätze effizient analysieren lassen, wenn vollständige Tabellenscans unnötig oder unpraktisch sind.

## Tabellen-Sampling

Tabellen-Sampling ermöglicht die Analyse eines **zufälligen Teilbereichs** einer großen Tabelle, anstatt alle Zeilen zu scannen. Dieser Ansatz ist nützlich, wenn:

* Trends und Muster untersucht werden sollen, nicht exakte Werte;
* Der Datensatz zu groß ist, um effizient gescannt zu werden;
* Abfragekosten und Ausführungszeit reduziert werden sollen.

Sampling setzt voraus, dass die Daten bereits bereinigt und repräsentativ sind, sodass sich aus einem kleineren Teil des Datensatzes verlässliche Erkenntnisse gewinnen lassen.

## Zugriff auf externe Daten über Google Cloud Storage

Wenn Datensätze zu groß sind, um sie direkt in BigQuery hochzuladen – oder nicht in Tools wie Tabellenkalkulationen geöffnet werden können – können sie in **Google Cloud Storage** gespeichert und extern abgefragt werden.

BigQuery ermöglicht die Verbindung zu Dateien, die im Cloud Storage gespeichert sind, und das Ausführen von Abfragen **ohne Import der Daten** in BigQuery selbst. Dieser Ansatz ist nützlich, wenn:

* Mit Daten aus externen Systemen oder von Partnern gearbeitet wird;
* Große Archive oder Protokolldateien analysiert werden;
* Speicher- und Importkosten niedrig gehalten werden sollen.

## Wichtigste Erkenntnis

Beim Arbeiten mit sehr großen Datensätzen gilt:

* **Sampling** verwenden, um Daten schneller und kostengünstiger zu analysieren und dennoch aussagekräftige Erkenntnisse zu erhalten;
* **Externe Datenverbindungen** nutzen, wenn ein vollständiger Datenimport nicht möglich ist.

Diese Techniken sorgen dafür, dass BigQuery-Workflows flexibel, kosteneffizient und skalierbar bleiben.


Tauchen Sie ein in die Grundlagen der BigQuery-Plattform und verändern Sie Ihren Umgang mit Cloud-Daten. Beherrschen Sie die Fähigkeiten, die für die Navigation in der Konsole, das Verwalten von Projekten und die Optimierung von Abfragekosten erforderlich sind. Sammeln Sie praktische Erfahrungen mit BigQuery-spezifischen Funktionen wie Array-Operationen, geografischen Daten und Datumsfunktionen. Entdecken Sie fortgeschrittene Optimierungstechniken und erfahren Sie die Geheimnisse des Aufbaus von Machine-Learning-Modellen direkt im Data Warehouse mit BigQuery ML.

Erwerben Sie ein fundiertes Verständnis der BigQuery-Umgebung, die sich von traditionellen Datenbanken unterscheidet. Lernen Sie, die Konsole zu navigieren, Projekte und Datasets zu verwalten sowie Kosten effektiv zu analysieren. Stärken Sie Ihr Vertrauen beim Einrichten Ihres Arbeitsbereichs für eine effiziente Datenanalyse.

Erkunden Sie die Grundlagen der Abfrage-Engine zur effizienten Datenabfrage. Beherrschen Sie Techniken zur Datenauswahl und lernen Sie die Analyse spezifischer Produktmetriken. Entdecken Sie Leistungsmerkmale und Methoden zur Überprüfung von Abfragen, um eine schnelle und präzise Analyse sicherzustellen.

Erweitern Sie Ihr Wissen durch das Beherrschen der einzigartigen Datentypen von BigQuery.
Umgang mit komplexen Array-Operationen und Manipulation von Datums- und Zeitfunktionen.
Erkundung geografischer Funktionen zur Lösung standortbezogener Herausforderungen wie der Berechnung von Städtedistanzen.

Optimieren Sie Ihren Arbeitsablauf durch das Verwalten großer Tabellen und die Verbesserung der Abfrageleistung.
Erkenntnisse über effektives Fehlerhandling zur schnellen Problemlösung.
Beherrschung der Fähigkeiten zur Aufrechterhaltung einer leistungsstarken Datenbankumgebung.

Wenden Sie Ihr Wissen in realen Szenarien an. Erfahren Sie, wie umfassende Berichte erstellt und BigQuery mit externen Tools integriert wird. Verwandeln Sie Rohdaten durch praktische Anwendung und Berichtsstrategien in umsetzbare Geschäftseinblicke.

Tauchen Sie ein in die Grundlagen von BigQuery ML. Erfahren Sie, wie Sie Machine-Learning-Modelle mit Standard-SQL erstellen und ausführen, ohne Daten zu verschieben. Sammeln Sie praktische Erfahrungen mit Modell-Durchläufen, um Vorhersagen direkt innerhalb der Plattform zu treffen.

Verwaltung Großer Tabellen

Tabellen-Sampling

Zugriff auf externe Daten über Google Cloud Storage

Wichtigste Erkenntnis