Contenu du cours
Introduction à l'Ingénierie des Données avec Azure
Introduction à l'Ingénierie des Données avec Azure
1. Commencer avec Azure et les Outils de Base
4. Résolution de Problèmes Pratiques avec ADF
Transformation de Colonne Dérivée
Les colonnes dérivées vous permettent d'améliorer vos données en créant de nouveaux champs ou en modifiant les champs existants en fonction de la logique métier. Cette fonctionnalité est essentielle pour enrichir votre ensemble de données afin de mieux servir les processus en aval tels que l'analyse, le reporting ou l'apprentissage automatique.
Par exemple, vous pourriez créer un champ FullName
en concaténant les prénoms et noms de famille ou dériver un DiscountedPrice
basé sur un champ Price
existant et un taux de remise.
Comment créer des colonnes dérivées dans ADF
- Ajoutez un nouveau flux de données dans la section Auteur de Azure Data Factory Studio;
- Faites glisser une Transformation de colonne dérivée depuis la boîte à outils sur le canevas du flux de données et connectez-la à votre source de données;
- Dans les paramètres de la Transformation de colonne dérivée, définissez le nom de la colonne pour le champ nouveau ou modifié, tel que
DeathRate
; - Écrivez une expression en utilisant le langage d'expression d'ADF. Par exemple, pour calculer un taux de mortalité :
iif(TotalDeaths > 0, (Covid19Deaths * 100.0) / TotalDeaths, 0.0)
; - Validez la configuration en prévisualisant les données pour vous assurer que la colonne dérivée est calculée correctement;
- Connectez les données transformées à une Transformation de destination pour les envoyer à une destination, telle qu'une table SQL ou un stockage Blob, pour un traitement ultérieur.
Tout était clair ?
Merci pour vos commentaires !
Section 3. Chapitre 2