Glissez pour afficher le menu

Découvrez le cycle de vie complet d’un modèle d’apprentissage automatique, de la préparation des données à l’interprétation des résultats pour les parties prenantes. Construisez et évaluez un modèle de régression linéaire directement dans BigQuery.

Préparation des données et conception du schéma

Avant de commencer la modélisation, il est nécessaire de définir l’emplacement et la structure des données :

Création d’un schéma : définir les noms de colonnes et les types de données afin de garantir un chargement et une interrogation corrects des données ;
Chargement et inspection des données : utiliser de petits ensembles de données pour observer les corrélations initiales, par exemple comment le nombre de chambres influence le prix des maisons ;
Compréhension des corrélations : combiner plusieurs caractéristiques pour révéler les relations prédictives fortes nécessaires aux applications réelles.

Entraînement du modèle et logique

L’apprentissage automatique consiste à enseigner à un modèle à reconnaître les relations mathématiques entre les entrées et les sorties :

Sélection du modèle : utiliser la régression linéaire pour prédire des résultats numériques continus ;
Définition des variables : définir la variable cible (par exemple, le prix) et les caractéristiques d’entrée (par exemple, la superficie et le nombre de chambres) ;
Processus d’apprentissage : l’entraînement se déroule en itérations où le modèle s’ajuste en fonction du taux d’apprentissage pour minimiser la perte (erreur quadratique moyenne).

Évaluation et validation

Pour garantir que votre modèle apprend réellement plutôt que de mémoriser, il est nécessaire de valider ses performances :

Séparation entraînement/évaluation : réserver environ 20 pour cent de vos données pour tester le modèle sur des exemples non vus ;
Métriques d’évaluation du modèle : utiliser (R-carré) pour mesurer la puissance prédictive, où des valeurs supérieures à 0,8 indiquent généralement une base solide ;
Comparaison des valeurs : analyser l’erreur en pourcentage entre les valeurs prédites et réelles pour confirmer la précision du modèle.

Génération de prédictions et interprétation

L’objectif final est de générer des informations exploitables à partir de nouvelles données :

Génération de prédictions : appliquer le modèle entraîné à de nouveaux enregistrements non vus pour simuler une utilisation réelle ;
Interprétation des poids : examiner les poids des caractéristiques pour déterminer quelles entrées, comme le nombre de chambres, ont la plus grande influence sur la prédiction finale ;
Intercepts de base : identifier l’intercept pour comprendre la prédiction de base lorsque toutes les caractéristiques d’entrée sont nulles.

Tout était clair ?

Merci pour vos commentaires !

Section 6. Chapitre 3

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Présentation du Modèle BigQuery ML