Summary  
This chapter explains how to manage very large tables in SQL by using table sampling to query a random subset of rows and by creating external table connections to data stored in cloud storage without full import.  

General domain of usage  
Data analytics

Leer hoe u met **zeer grote tabellen in BigQuery** kunt werken zonder buitensporige kosten of prestatieproblemen. Ontdek **tabelsampling** en **externe dataverbindingen**, twee technieken die helpen om grote datasets efficiënt te analyseren wanneer volledige tabelscans onnodig of onpraktisch zijn.

## Tabelsampling

Tabelsampling maakt het mogelijk om een **willekeurige subset** van een grote tabel te analyseren in plaats van alle rijen te scannen. Deze aanpak is nuttig wanneer:

* U trends en patronen onderzoekt in plaats van exacte waarden;
* De dataset te groot is om efficiënt te scannen;
* U de kosten en uitvoeringstijd van queries wilt verminderen.

Sampling gaat ervan uit dat de data al schoon en representatief is, waardoor het mogelijk is om betrouwbare inzichten te verkrijgen uit een kleiner deel van de dataset.

## Toegang tot externe data via Google Cloud Storage

Wanneer datasets te groot zijn om direct in BigQuery te uploaden — of niet geopend kunnen worden in tools zoals spreadsheets — kunt u ze opslaan in **Google Cloud Storage** en extern raadplegen.

BigQuery maakt het mogelijk om verbinding te maken met bestanden die zijn opgeslagen in Cloud Storage en queries uit te voeren **zonder de data te importeren** in BigQuery zelf. Deze aanpak is nuttig wanneer:

* U werkt met data uit externe systemen of samenwerkingspartners;
* U grote archieven of logbestanden analyseert;
* U opslag- en importkosten laag wilt houden.

## Belangrijkste inzicht

Bij het werken met enorme datasets:

* Gebruik **sampling** om data sneller en goedkoper te analyseren, terwijl de algemene inzichten behouden blijven;
* Gebruik **externe dataverbindingen** wanneer volledige data-upload niet haalbaar is.

Deze technieken houden BigQuery-workflows flexibel, kostenefficiënt en schaalbaar.


Verdiep je in de basisprincipes van het BigQuery-platform en transformeer de manier waarop je clouddata beheert. Beheers de vaardigheden die nodig zijn om de console te navigeren, projecten te beheren en querykosten te optimaliseren. Doe praktische ervaring op met BigQuery-specifieke functies zoals arraybewerkingen, geografische data en datumfuncties. Ontdek geavanceerde optimalisatietechnieken en leer de geheimen van het bouwen van machine learning-modellen direct binnen het datawarehouse met BigQuery ML.

Verkrijg een grondig begrip van de BigQuery-omgeving, verschillend van traditionele databases. Navigatie door de console, project- en datasetbeheer en kostenanalyse. Vertrouwen opbouwen in het inrichten van de werkruimte voor efficiënte data-analyse.

Verken de basisprincipes van de Query Engine voor efficiënte gegevensopvraging. Beheers technieken voor gegevensselectie en leer hoe specifieke productstatistieken geanalyseerd kunnen worden. Ontdek prestatiekenmerken en methoden voor het testen van queries om te waarborgen dat analyses snel en nauwkeurig zijn.

Breng uw kennis naar een hoger niveau door BigQuery-specifieke gegevenstypen te beheersen. Leer complexe array-bewerkingen uit te voeren en datum- en tijdfuncties te manipuleren. Verken geografische functies om locatiegebonden vraagstukken op te lossen, zoals het berekenen van afstanden tussen steden.

Optimaliseer uw workflow door grote tabellen te beheren en de queryprestaties te verbeteren. Ontdek de geheimen van effectieve foutafhandeling voor snelle probleemoplossing. Beheers de vaardigheden die nodig zijn om een databaseomgeving met hoge prestaties te onderhouden.

Pas uw kennis toe op praktijksituaties. Ontdek hoe u uitgebreide rapporten opstelt en BigQuery integreert met externe tools. Zet ruwe gegevens om in bruikbare zakelijke inzichten via praktische toepassingen en rapportagestrategieën.

Verdiep u in de basisprincipes van BigQuery ML. Ontdek hoe u machine learning-modellen kunt maken en uitvoeren met standaard SQL zonder data te verplaatsen. Verkrijg praktische ervaring met modeldemonstraties om uitkomsten direct binnen het platform te voorspellen.

Beheer van Grote Tabellen

Tabelsampling

Toegang tot externe data via Google Cloud Storage

Belangrijkste inzicht