Desliza para mostrar el menú

Descubre el ciclo de vida completo de un modelo de aprendizaje automático, desde la preparación de los datos hasta la interpretación de los resultados para las partes interesadas. Construye y evalúa un modelo de regresión lineal directamente en BigQuery.

Preparación de Datos y Diseño de Esquema

Antes de comenzar el modelado, es necesario definir dónde residen los datos y cómo están estructurados:

Creación de un esquema: definir los nombres de las columnas y los tipos de datos para asegurar que los datos se puedan cargar y consultar correctamente;
Carga e inspección de datos: utilizar conjuntos de datos pequeños para observar correlaciones iniciales, como la influencia del número de dormitorios en los precios de las viviendas;
Comprensión de correlaciones: combinar múltiples características para descubrir relaciones predictivas sólidas necesarias para aplicaciones del mundo real.

Entrenamiento y Lógica del Modelo

El aprendizaje automático implica enseñar a un modelo a reconocer relaciones matemáticas entre entradas y salidas:

Selección del modelo: utilizar regresión lineal para predecir resultados numéricos continuos;
Definición de variables: establecer la variable objetivo (por ejemplo, precio) y las características de entrada (por ejemplo, metros cuadrados y dormitorios);
El proceso de aprendizaje: el entrenamiento ocurre en iteraciones donde el modelo se ajusta según la tasa de aprendizaje para minimizar la pérdida (error cuadrático medio).

Evaluación y Validación

Para asegurar que el modelo realmente aprende y no memoriza, es necesario validar su rendimiento:

División de entrenamiento y evaluación: reservar aproximadamente el 20 por ciento de los datos para probar el modelo con ejemplos no vistos;
Métricas de evaluación del modelo: utilizar (R-cuadrado) para medir el poder predictivo, donde valores superiores a 0.8 suelen indicar una base sólida;
Comparación de valores: analizar el porcentaje de error entre los valores predichos y reales para confirmar la precisión del modelo.

Generación de Predicciones e Interpretación

El objetivo final es generar información útil a partir de nuevos datos:

Generación de predicciones: aplicar el modelo entrenado a nuevos registros no vistos para simular el uso en el mundo real;
Interpretación de pesos: examinar los pesos de las características para determinar qué entradas, como el número de dormitorios, tienen mayor influencia en la predicción final;
Interceptos base: identificar el intercepto para comprender la predicción base cuando todas las características de entrada son cero.

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 6. Capítulo 3

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Recorrido por el Modelo de BigQuery ML