OSBI.FR - Open Source Business Intelligence

Kettle 4.0

Pentaho Data Integration (aka Kettle) continue son bonhomme de chemin, la v4.0 est dans les tuyaux avec beaucoup d’améliorations en vue. Matt Casters nous concocte comme à son habitude un excellent cru, voici une brève synthèse des nouveautés de cette version :

  • Kettle 4 fournira une amélioration notable de la gestion du travail collaboratif, qui reste un point très sensible dans la v3 malgré une gestion très commode des users et des jobs dans un référentiel (le « kettle repository » stocké dans un SGBD). En effet actuellement il est très facile de détruire ou écraser par inadvertance un job conçu par un autre développeur. Pour remédier au pb, Kettle v4 verra l’apparition des mécanismes suivants : Check in/Check out, Versionning avancé, amélioration de la gestion de la sécurité avec notamment la récupération de celle-ci depuis des groupes LDAP. Tout ceci sera mis en place avec le système de stockage CMIS (le top du top dans ce domaine). Toutefois en attendant d’arriver sur du CMIS, Matt nous précise que l’implémentation est réalisée sous JCR pour la version Enterprise et SVN pour la Community. 😉
  • Le système de logging des transformations/jobs va être nettement amélioré (voir la vidéo ci-dessous)
  • La possibilité de planifier directement les jobs depuis Spoon (En V3 il existe 2 méthodes: soit on planifie en ligne de commande sous unix/windows le déclenchement des jobs via Kitchen, soit on passe par le scheduler de la plate-forme Pentaho, si bien sûr on a installé un serveur Pentaho !)
  • Comme à chaque version, des améliorations ergonomiques du client de design graphique Spoon sont prévues, notamment les « mini-steps icons » qui permettront de « câbler » de manière plus intuitive des étapes spécifiques, notamment celles qui intègrent des flux d’informations additionnels ou qui gèrent l’implémentation des erreurs (voir les vidéos ci-dessous)

Retrouvez le contenu détaillé des évolutions Kettle V4 ici.

Pour une présentation plus détaillée et commentée, je vous conseille le webinar WebEx donné par Matt Casters le 17 Juillet 2009. en attendant celui prévu le 18 Novembre

Et si vous avez besoin d’être « initié » à Kettle , j’anime régulièrement sur site ou dans les locaux d’Atol CD une formation « Easy Quick Start » qui permet d’être rapidement autonome sur PDI (1 jour).

A l’issue de cette journée de formation, chaque participant a compris les concepts et les cas d’utilisation de Kettle ainsi que le développement de jobs d’intégration de données avec Spoon 🙂

La gestion des logs dans Kettle 4 (Vidéo) :

Les « mini-steps icons » (Vidéo 1) :

Les « mini-steps icons » (Vidéo 2) :

Les « mini-steps icons » (Vidéo 3) :

2 Comments

  1. Merci pour la pub Sylvain.

    Les moteurs pour les répositoires Kettles 4.0 sont en fait des plugins (API ouvert). Nous utilisons JCR pour l’Edition Enterprise, Subversion en cours pour la version communauté. On va supporter CMIS dans la future prôche aussi (quand c’est stabilisé) et pourquoi pas, Google Wave protocol, etc.

    A+,
    Matt

  2. Bonjour Matt,

    Merci pour cette info, je vais mettre à jour ce point dans l’article

    Content de voir qu’on va bientôt utiliser SVN pour la community 🙂

    Sylvain

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*