Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Introducción a BigQuery ML | Aprendizaje Automático en BigQuery
Fundamentos de BigQuery

bookIntroducción a BigQuery ML

Desliza para mostrar el menú

Explora BigQuery Machine Learning (BigQuery ML), una funcionalidad que permite crear y desplegar modelos de aprendizaje automático directamente en la interfaz de BigQuery utilizando SQL. Elimina la necesidad de Python o frameworks externos de ML para ejecutar modelos predictivos y de agrupamiento sin salir del entorno del almacén de datos.

BigQuery ML representa un avance importante al simplificar el acceso a capacidades de aprendizaje automático, combinando escalabilidad, facilidad de uso e integración de datos sin fisuras.

No se requiere Python

BigQuery ML permite crear, entrenar y evaluar modelos utilizando sintaxis SQL pura. Esto elimina la complejidad de aprender lenguajes de programación adicionales y permite que cualquier persona familiarizada con SQL participe en flujos de trabajo de análisis predictivo y ciencia de datos.

Ejemplo:

CREATE MODEL `project.dataset.model_name`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.table;

Los datos nunca salen de BigQuery

Todo el procesamiento ocurre dentro del entorno de BigQuery. No es necesario exportar ni importar datos a otra herramienta. Esto garantiza tanto la seguridad de los datos como la eficiencia, evitando infraestructura innecesaria o dependencias externas.

Totalmente gestionado y sin servidores

BigQuery ML es serverless — lo que significa que Google gestiona automáticamente la infraestructura, la escalabilidad y la asignación de recursos. No es necesario aprovisionar servidores adicionales ni administrar entornos.

Beneficios

  • Facilidad de uso: solo se requiere conocimiento de SQL para comenzar;
  • Localidad de los datos: los modelos se entrenan directamente sobre los datos ya presentes en BigQuery;
  • Sin sobrecarga de infraestructura: no se necesitan entornos de ML separados ni clústeres de cómputo;
  • Información más rápida: crea, entrena y evalúa modelos en minutos en lugar de días.

Funciones principales

CREATE MODEL

Define y entrena un modelo. Ejemplo:

CREATE MODEL `dataset.sales_forecast`
OPTIONS(model_type='linear_reg') AS
SELECT * FROM dataset.sales_data;

EVALUATE

Mide el rendimiento del modelo analizando métricas como R-cuadrado, RMSE y margen de error. Comprender estas métricas garantiza que los modelos sean estadísticamente válidos y confiables.

PREDICT

Genera predicciones utilizando el modelo entrenado. Normalmente, el 80% de los datos se utiliza para entrenamiento y el 20% para pruebas, asegurando un rendimiento equilibrado.

EXPLAIN

Interpreta el modelo identificando qué características influyen más en el resultado predicho. Esto ayuda a detectar el sobreajuste (demasiadas características irrelevantes) y garantiza la interpretabilidad.

question mark

¿Qué afirmaciones describen con precisión las características o beneficios principales de BigQuery ML?

Selecciona todas las respuestas correctas

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 6. Capítulo 1

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 6. Capítulo 1
some-alt