Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Gerenciamento de Tabelas Grandes | Aplicações Avançadas do BigQuery e Otimização
Fundamentos do BigQuery

bookGerenciamento de Tabelas Grandes

Deslize para mostrar o menu

Aprenda a trabalhar com tabelas muito grandes no BigQuery sem custos excessivos ou problemas de desempenho. Explore amostragem de tabelas e conexões com dados externos, duas técnicas que ajudam a analisar grandes conjuntos de dados de forma eficiente quando varreduras completas não são necessárias ou viáveis.

Amostragem de Tabelas

A amostragem de tabelas permite analisar um subconjunto aleatório de uma tabela grande em vez de escanear todas as linhas. Essa abordagem é útil quando:

  • Você está explorando tendências e padrões em vez de valores exatos;
  • O conjunto de dados é grande demais para ser escaneado de forma eficiente;
  • Você deseja reduzir o custo e o tempo de execução da consulta.

A amostragem pressupõe que os dados já estão limpos e são representativos, tornando possível obter insights confiáveis a partir de uma parte menor do conjunto de dados.

Acessando Dados Externos via Google Cloud Storage

Quando conjuntos de dados são grandes demais para serem enviados diretamente ao BigQuery — ou não podem ser abertos em ferramentas como planilhas — você pode armazená-los no Google Cloud Storage e consultá-los externamente.

O BigQuery permite conectar-se a arquivos armazenados no Cloud Storage e executar consultas sem importar os dados para o próprio BigQuery. Essa abordagem é útil quando:

  • Trabalhando com dados de sistemas externos ou colaboradores;
  • Analisando grandes arquivos de logs ou arquivos de arquivamento;
  • Mantendo baixos os custos de armazenamento e ingestão.

Ponto Principal

Ao trabalhar com conjuntos de dados massivos:

  • Utilize a amostragem para analisar dados de forma mais rápida e econômica, preservando os insights gerais;
  • Utilize conexões com dados externos quando o envio completo dos dados não for viável.

Essas técnicas ajudam a manter os fluxos de trabalho do BigQuery flexíveis, econômicos e escaláveis.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 2

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 4. Capítulo 2
some-alt