Contenu du cours
Introduction à l'Ingénierie des Données avec Azure
Introduction à l'Ingénierie des Données avec Azure
1. Commencer avec Azure et les Outils de Base
4. Résolution de Problèmes Pratiques avec ADF
Combiner des Données avec des Jointures
Les données résident souvent dans plusieurs tables ou sources, ce qui rend essentiel de fusionner les informations pour obtenir des insights significatifs. Dans ce chapitre, vous apprendrez à utiliser les jointures dans Azure Data Factory (ADF) Data Flows pour fusionner efficacement les ensembles de données.
ADF prend en charge plusieurs types de jointures :
- Jointure interne : combine les lignes où les clés correspondent dans les deux ensembles de données ;
- Jointure externe gauche : inclut toutes les lignes de l'ensemble de données de gauche et les lignes correspondantes de droite ;
- Jointure externe droite : inclut toutes les lignes de l'ensemble de données de droite et les lignes correspondantes de gauche ;
- Jointure externe complète : inclut toutes les lignes des deux ensembles de données, avec des valeurs nulles pour les lignes non appariées ;
- Jointure croisée : produit un produit cartésien des deux ensembles de données.
Comment Combiner des Données avec des Joins dans ADF
- Créez un nouveau Flux de Données ou utilisez un existant ;
- Faites glisser deux Transformations Source sur le canevas du Flux de Données et connectez-les aux tables SQL respectives ;
- Faites glisser une Transformation de Join depuis la boîte à outils sur le canevas et connectez-y les deux sources ;
- Dans les paramètres de la Transformation de Join, sélectionnez le Type de Join et définissez la Condition de Join ;
- Ajoutez une Transformation de Colonne Dérivée ou toute autre transformation après le join pour obtenir des insights ;
- Ajoutez une Transformation de Destination pour stocker le résultat ;
- Validez la configuration du Flux de Données pour vous assurer que tout est correct.
Tout était clair ?
Merci pour vos commentaires !
Section 3. Chapitre 3