J’ai effectué mon stage de projet de fin d’etudes au sein de l’entreprise SAP Labs R&D à Paris entre 22/02/2016 et 21/08/2016. Cette expérience a été l’occasion d’approfondir ma connaissance du domaine de Data Warehouse. J’ai eu l’opportunité d’expérimenter l’environnement de R&D et d’implémenter un service de Data Lineage Analysis (Analyse du lignage des données) qui devient de plus en plus un besoin dans l’environnement de Data Warehouse.
Mes tuteurs sont Eric Simon et François Llirbat.
Mon stage contient 3 grandes étapes:
- Implémenter les algorithmes de Data Lineage orienté-utilisateur et au niveau du schéma en SQL Script (L’aspect qu’on veut élaborer dans ce travail est la distinction des perspectives de l’analyse du lignage des données pour répondre aux besoins de gestion et gouvernance de données. C’est-à-dire qu’un utilisateur métier (Business user) et un développeur n’ont pas la même tendance à voir dans l’analyse de lignage des données. Donc, il faudrait faire une distinction selon le type de l’utilisateur. En outre, il se peut qu’une seule personne performe plusieurs perspectives pour comprendre mieux le contexte.)
- Créer une interface graphique en utilisant le framework SAP UI5 et le diagramme d’éditeur SAP Galilei afin de visualiser un graphe de Data Lineage Analysis et permettre l’utilisatuer de faire des interactions avec le graphe en sortie.
- Créer un générateur de graphe aléatoire synthétique en respectant les contraintes d’un graphe de Data Lineage afin de mésurer la performance des algorithmes implémentés (on n’aurait pas pu utiliser un générateur de graphe aléatoire simple car il y a d’autres propriétés que l’identifiant de noeud et l’identifiant d’arc dans un graphe de Data Lineage Analysis. Par exemple, il y a 3 types d’arc: Lineage, Computation Node et Schema Definition)
Entre-temps, j’ai fait mon soutenance de PFE le 27 juin 2016 (2 mois avant de la fin de mon stage). Donc, les rapports de synthèse et de recherche situés ci-dessous ne contiennent pas la dernière partie du stage (Etape 3).
Vous pouvez trouver mon rapport de synthèse: ici
Vous pouvez trouver mon rapport de recherche: ici