Summary  
This chapter explains how to manage very large tables in SQL by using table sampling to query a random subset of rows and by creating external table connections to data stored in cloud storage without full import.  

General domain of usage  
Data analytics

Дізнайтеся, як працювати з **дуже великими таблицями в BigQuery** без надмірних витрат або проблем із продуктивністю. Ознайомтеся з методами **вибіркового аналізу таблиць** та **підключення до зовнішніх даних** — двома підходами, які дозволяють ефективно аналізувати великі набори даних, коли повне сканування таблиці є непотрібним або недоцільним.

## Вибірковий аналіз таблиць

Вибірковий аналіз дозволяє досліджувати **випадкову підмножину** великої таблиці замість сканування всіх рядків. Цей підхід корисний, коли:

* Досліджуються тенденції та закономірності, а не точні значення;
* Набір даних занадто великий для ефективного сканування;
* Необхідно зменшити вартість запиту та час виконання.

Вибірковий аналіз передбачає, що дані вже очищені та репрезентативні, що дозволяє отримувати надійні висновки з меншої частини набору даних.

## Доступ до зовнішніх даних через Google Cloud Storage

Коли набори даних занадто великі для прямого завантаження в BigQuery — або їх неможливо відкрити у таких інструментах, як електронні таблиці — їх можна зберігати у **Google Cloud Storage** та виконувати зовнішні запити.

BigQuery дозволяє підключатися до файлів, що зберігаються у Cloud Storage, і виконувати запити **без імпорту даних** безпосередньо у BigQuery. Цей підхід корисний, коли:

* Працюєте з даними із зовнішніх систем або від партнерів;
* Аналізуєте великі архіви чи журнальні файли;
* Потрібно мінімізувати витрати на зберігання та завантаження.

## Основний висновок

Працюючи з масивними наборами даних:

* Використовуйте **вибірковий аналіз**, щоб швидше та дешевше отримувати загальні висновки;
* Використовуйте **зовнішні підключення до даних**, коли повне завантаження даних неможливе.

Ці підходи допомагають зробити робочі процеси в BigQuery гнучкими, економічними та масштабованими.


Занурення в основи платформи BigQuery та трансформація підходу до роботи з хмарними даними. Оволодіння навичками навігації консоллю, управління проєктами та оптимізації витрат на запити. Практичний досвід роботи з особливостями BigQuery, такими як операції з масивами, географічні дані та функції дат. Вивчення передових методів оптимізації та особливостей побудови моделей машинного навчання безпосередньо у сховищі за допомогою BigQuery ML.

Отримайте ґрунтовне розуміння середовища BigQuery, яке відрізняється від традиційних баз даних. Навчіться орієнтуватися в консолі, керувати проєктами та наборами даних, а також ефективно аналізувати витрати. Сформуйте впевненість у налаштуванні робочого простору для ефективного аналізу даних.

Ознайомтеся з основами рушія запитів для ефективного отримання даних. Опануйте техніки вибору даних та навчіться аналізувати окремі метрики продукту. Дізнайтеся про особливості продуктивності та методи тестування запитів для забезпечення швидкого й точного аналізу.

Поглиблене вивчення унікальних типів даних BigQuery. Робота зі складними операціями над масивами та обробка функцій дати й часу. Дослідження географічних можливостей для вирішення задач, пов’язаних із розташуванням, таких як обчислення відстаней між містами.

Оптимізація робочого процесу шляхом керування великими таблицями та підвищення продуктивності запитів. Вивчення ефективних методів обробки помилок для швидкого усунення проблем. Оволодіння навичками підтримки високопродуктивного середовища баз даних.

Застосовуйте набуті знання у реальних сценаріях. Дізнайтеся, як створювати комплексні звіти та інтегрувати BigQuery із зовнішніми інструментами. Перетворюйте необроблені дані на практичні бізнес-інсайти за допомогою прикладних методів та стратегій звітування.

Занурення в основи BigQuery ML. Ознайомлення зі створенням і виконанням моделей машинного навчання за допомогою стандартного SQL без переміщення даних. Практичний досвід роботи з моделями для прогнозування результатів безпосередньо на платформі.

Керування Великими Таблицями

Вибірковий аналіз таблиць

Доступ до зовнішніх даних через Google Cloud Storage

Основний висновок