OSBI.FR - Open Source Business Intelligence

Comparatifs d’ETL propriétaires & open Source

En me « promenant » sur le site de Pentaho, et en téléchargeant une étude du Forrester (que je n’ai pas encore lue d’ailleurs), je suis tombé sur une page très intéressante qui m’a fait découvrir le white paper ETL tools comparison de Jonathan Levin, un blogger dont le sujet de prédilection est MySql (mysqlbarbeque.blogspot.com)

Comme je suis toujours intéressé de voir les divers benchmarks ETL disponibles sur le web (il y en a peu), je me suis empressé de le télécharger. Ne serait-ce que parce que j’ai été moi-même ? l’origine du livre blanc « Les ETL Open Source, une véritable alternative aux solutions propriétaires« , et que j’aime bien lire d’autres avis et retours d’expériences sur ce genre d’outils.

Ce fameux document, le voici: ETL Tools comparison, ainsi que le post qui s’y rapporte sur le blog de Jonathan Levin.

Quelques remarques tout de même sur l’ensemble:

  • Dire que Kettle est au moins deux fois plus rapide que Talend est vraiment exagéré, surtout sans exemple concret et précis (et c’est un fan de Kettle qui le dit). Talend est tout aussi intéressant que Kettle. Toutefois, comme l’indique Jonathan Levin, Kettle l’emporte en ce qui concerne son interface et sa prise en main très intuitive. Au passage, je connais quelques personnes qui dénigraient gentiment Talend il y a quelque mois, et qui désormais ont changé leur fusil d’épaule et font de la publicité pour ce produit… Ils se reconnaîtront et je les salue bien amicalement (j’attends de boire une bonne bière avec eux… ça fera du bien de discuter autour d’une mousse)
  • Les uses case du PDF reprennent les expériences de 4 des clients de Pentaho. Il suffit de vérifier ici: http://www.pentaho.com/about/customers. En soit, cela n’est pas très grave, mais cela se confirme dans la page de conclusion, qui est d’une teneur plutôt surprenante : « Informatica et Pentaho ont de très bons produits » – « Informatica a une gamme de produits plus étendue que Pentaho, mais est beaucoup plus coûteux » – « Pentaho a prouvé qu’il pouvait êtré implémenté sur des systèmes de toutes tailles« . Moi j’aurai bien ajouté « Sans nuages et de jour, le ciel est bleu » ou « Il n’y a pas de fumée sans feu » 🙂
  • La comparaison entre Kettle et Informatica Power Center est très intéressante. Moi j’aimerai beaucoup faire des tests comparatifs entre un ETL propriétaire (Informatica donc) et Kettle. Le problème est que je n’ai pas les moyens d’acheter une licence Informatica… donc je suis coincé. Mais je me doute bien qu’Informatica doit vraiment être un outil très puissant.
  • Le tableau comparatif page 18 (ou 37 c’est le même…!) est intéressant dans son approche visuelle. Je me permets donc de restituer ma version ici pour Kettle et Talend :

2 Comments

  1. Merci Sylvain pour ce post … et comme on peut de nouveau placer des commentaires, j’y vais de ma petite phrase.

    En fait, cet article est assez surprenant (j’ai downloadé le PDF, qui est sans réel intérêt ? mon goût) : découvrir parmi les 4 ETL testé ‘Inaplex’, un ETL qui a des limitations en terme de connectivité sur les bases (pour un ETL … on croit rêver !), et l’absence de superbes ETL comme Datastage ou Microsoft DTS, cela pose tout de suite le problème de la neutralité du document. Passe encore qu’on ne garde qu’un seul ETL commercial, mais alors : quid de Ketl ou encore octopus, qui sont eux aussi Open Source et respectables. On aurait apprécié, comme dans ton étude, une comparaison sur la disponibilité des fonctions spécifiques aux ETL. Je ressort comme toi, avec le sentiment d’un document pas trop objectif, donc pouvant être interprété de différentes façons
    L’aspect performance m’intéresse un peu moins : quand on voit comment on utilise aujourd’hui les ETL dans certains projets (data management et data transfert), et les possibilités extraordinaires de Kettle et Talend, on sait tout de suite que ces ETL répondront aux contraintes de performance.
    Patrick

  2. Salut Patrick.

    En effet ce document ne présente que peu d’intérêt, par contre le document publié par Forrester dont je parle au début de mon post va faire l’objet d’un autre post (cette semaine sûrement).
    Ce white-paper est nettement plus intéressant et d’une très bonne qualité, car il met en avant l’alternative de l’utilisation des ETL Open Source en regard des ETL propriétaires.
    Et l? , les 4 ETL Open source considérés sont KETL, clover.ETL, Kettle et Talend (pas de surprise donc….)

    A suivre donc !
    Très bon début de semaine du côté de Lyon

    Sylvain

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*