Contenu du cours
Introduction à l'Ingénierie des Données avec Azure
Introduction à l'Ingénierie des Données avec Azure
Comprendre les Flux de Données dans Azure Data Factory
Par exemple, imaginez un scénario où vous devez nettoyer, enrichir et agréger des données de ventes provenant de plusieurs régions. Au lieu d'écrire des scripts SQL ou Python étendus, vous pouvez utiliser un flux de données pour cartographier visuellement ces transformations et les exécuter de manière transparente au sein d'ADF.
Composants clés des flux de données
- Transformation de la source : définit l'origine des données, comme le stockage Blob ou une base de données SQL ;
- Transformations : incluent des outils tels que le filtrage, la jonction, l'agrégation ou la dérivation de nouvelles colonnes pour manipuler les données ;
- Transformation de la destination : spécifie la destination des données traitées, comme une autre base de données SQL, un lac de données ou un stockage de fichiers.
Nous commencerons notre travail en créant un flux de données simple avec des transformations de source et de destination.
Comment configurer une transformation de source
- Ajoutez un nouveau flux de données dans la section Auteur de Azure Data Factory Studio ;
- Faites glisser une transformation de source depuis la boîte à outils vers le canevas du flux de données ;
- Dans les paramètres de transformation de source, sélectionnez un service lié, tel que Azure SQL Database ou Azure Blob Storage, pour vous connecter à votre source de données ;
- Choisissez un ensemble de données existant ou créez un nouvel ensemble de données qui représente les données à ingérer ;
- Configurez les options de format de fichier si vous vous connectez à Blob Storage, ou fournissez une requête SQL pour filtrer ou structurer les données entrantes pour les bases de données ;
- Validez la configuration et prévisualisez les données pour vous assurer que la source est correctement configurée.
Transformation de destination pour les données traitées
Après avoir défini les transformations, utilisez une transformation de destination pour spécifier où les données transformées seront stockées. Par exemple, vous pourriez enregistrer les données agrégées dans la base de données SQL ou les exporter sous forme de fichier CSV vers Blob Storage.
Merci pour vos commentaires !