Etape 3

L’objectif de cette phase est de mesurer la performance des procédures stockées de Data Lineage. Nous avons d’abord réalisé un état de l’art sur la génération d’un graphe aléatoire. Nous avons chosi d’utiliser le langage SQL Script et nous avons directement créé un générateur de graphe aléatoire à l’intérieur de la base de données de HANA en utilisant des procédures stockées. Etant donné que le langage SQL Script est plus lent par rapport au langage C/C++, nous avons dû réfléchir des solutions afin d’accélérer la génération d’un graphe aléatoire. Et nous avons utilisé 2 idées suivantes:
– L’utilisation des motifs préconstruits pour charger plus vite le contenu des design objects
– Dupliquer un graphe aléatoire déjà généré pour avoir un graphe plus gros
On mesure la performance des procédures stockées de Data Lineage en 2 aspects:
• le nombre de tables/vues.
• le nombre de nœuds utilisé dans les contenus des design objects
Et donc les questions qui se posent sont les suivantes:
1) Qu’est-ce qui se passe quand on augmente le nombre de tables/vues?
2) Qu’est-ce qui se passe quand on augmente le nombre de nœuds utilisés dans les contenues des design objects ?
Vous pouvez trouver un document qui explique ce qui a été fait pendant la dernière phase ci-dessous: