OSBI.FR - Open Source Business Intelligence

L’étape « Analytical Query » de PDI

Voilà bien longtemps que je souhaitais laisser un petit mémo sur l’étape « Analytical Query » disponible dans Pentaho Data Integration (PDI) : une étape plutôt discrète mais qui peut s’avérer d’une grande utilité !

Cette étape, traduite en français par « Déplacement dans flux », est disponible dans la catégorie « Statistiques » de Spoon, et permet de récupérer des informations situées dans l’enregistrement qui suit ou qui précède l’enregistrement courant dans le flux Kettle. Bien pratique dans certains cas de figures, en voici un exemple ci-dessous.

Imaginez que vous ayez une table de suivi opérationnel qui trace tous les changements de tarif de vos articles :

L’idée serait, à partir des données de cette table, de charger une table orientée « dimension articles historisée » – donc adaptée à un usage décisionnel – dans laquelle seraient indiquées les plages temporelles de validité (date début & date de fin) d’un article et d’un tarif donné.

Genre ceci :

L’étape qui va permettre d’effectuer ceci dans PDI, c’est la brique « Analytical Query ».

Celle-ci va trouver pour l’enregistrement courant (donc celui où on a la date de début), l’enregistrement qui le suit directement par rapport à une clef de tri (article & date), y trouver la date de fin, puis placer le tout dans la même ligne, comme ceci :

Simple, mais terriblement efficace !

A noter que dans cet exemple on avance de 1 seule ligne, mais en fonction des besoins on peut également avancer ou reculer de N lignes (à vous de choisir la valeur de N). Plutôt sympa non ?

Pour voir dans le détail comme cela fonctionne, vous pouvez télécharger cet exemple ici :

A bientôt !

Soyez le premier à commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*