OSBI.FR - Open Source Business Intelligence

Initiez-vous à Pentaho… avec un livre en français !

Il y a presque un an, je publiais ici-même un petit sondage posant cette question :

« Achèteriez-vous un livre en français détaillant de façon pratique la mise en oeuvre de la solution Pentaho ? »

A l’époque, vous aviez été une bonne soixantaine à participer, 90% ayant des votants ayant répondu OUI.

Sachez donc que ce livre tant attendu vient de sortir, aux éditions ENI.

Il s’agit de« Pentaho – Mise en place d’une solution Open Source de Business Intelligence », un livre en français exclusivement consacré à la plate-forme Pentaho.

Ecrit par Christian Vigouroux (Maître de Conférences à l’université de Rennes I), c’est un excellent support pour ceux qui souhaitent s’initier à l’OSBI avec la plate-forme Pentaho dans sa version gratuite (Community Edition), en se familiarisant avec l’ensemble des composants de cette suite décisionnelle.

De mon côté, j’ai acheté et lu entièrement ce livre toute la semaine dernière afin de vous en proposer une revue détaillée  (voir ci-dessous)

Pour information, cet ouvrage vient enrichir une bibliothèque déjà complète de livres (en anglais) autour de la plate-forme Pentaho :

Contenu du livre

Après une première partie consacrée à une prise en main rapide de Pentaho (Chapitres 1 et 2) et quelques rappels fondamentaux sur l’informatique décisionnelle au chapitre 3 (introduction à l’OLAP), l’auteur présente successivement l’ensemble des outils de développement fournis avec la suite Pentaho, avec de nombreux exemples de mise en oeuvre pratique :

  • Pentaho Data Integration [Chap. 4 et 5] : De nombreuses transformations vous permettront de comprendre la manipulation des étapes de bases de PDI: extraction/insertion en base de données (MySQL, SQL Server, MS Access), extraction/alimentation de fichiers plats (CSV, XLS , XML), Filtrage de données, Recherches (lookups), Agrégations, Mise en place de jobs avec récupération de fichiers via FTP…
  • Présentation du Web Ad Hoc Query Reporting (WAQR) [Chap. 6] : Découverte et utilisation du module de requêtage web via des vues métiers. Vous découvrirez ainsi comment un utilisateur final peut effectuer des requêtes pour faire des exports  de données sans aucune connaissance du langage SQL.
  • Pentaho Report Designer [Chap. 8 et 9] : Présentation et création de rapports avec le module de reporting de Pentaho. Vous apprendrez dans cette section comment créer vos propres rapports avec l’assistant de création de rapports (Wizard). Sont également passés en revue: les groupes de rapport, la mise en place de paramètres dynamiques, les fonctions de formatage, les fonctions (champs calculés), les sous-rapports avec le mécanisme de Drill-Down, un exemple de graphique (secteur)
  • Mondrian & JPivot [Chap. 10 et 11] : Dans ces 2 chapitres, l’auteur nous propose de découvrir le moteur ROLAP Mondrian et le requêteur web associé JPivot. Au menu, installation de Mondrian en stand-alone sur un serveur Tomcat, schémas en étoile (tables de faits/dimensions), schéma XML Mondrian et langage MDX pour le multi-dimensionnel…
  • Pentaho Schema Workbench [Chap. 12] :  Exemple de modélisation d’un cube Mondrian avec PSW et publication sur le serveur Pentaho.
  • Pentaho Aggregation Designer [Chap. 13] : Découvrez comment optimiser les temps de réponse du moteur Mondrian sur des tables de faits à forte volumétrie
  • Pentaho Design Studio [Chap. 14] : Mettez en place une Xaction (action séquence) simple, avec Pentaho Design Studio.
  • Intégration du BIRT Viewer [Chap. 15] : Ce chapitre s’inspire d’un article d’osbi.fr dans lequel il était expliqué l’intégration du BIRT Viewer dans Pentaho. Il y est expliqué comment intégrer le plugin développé par Bart Maertens pour intégrer le visualisateur web de BIRT.
  • Analyse de données avec Weka [Chap. 16] : Présentation synthétique du module de data-mining proposé par Pentaho
  • Pentaho Metadata Editor [Chap. 17] : Exemple de mise en place d’un domaine de métadonnées avec PME

Quelques précisions :

Ce livre s’appuie sur la version 3.6 de Pentaho, or Pentaho évolue vite (version stable actuelle = 3.8).

Cela signifie que certaines fonctionnalités présentées sont (déjà) obsolètes !

Juste un exemple, la mise en place de l’url de drill-down d’un rapport à un autre s’effectue désormais via une interface spécifique de configuration (voir mon article sur Pentaho 3.7)

D’ailleurs mon petit doigt me dit que les 2 outils Pentaho Schema Workbench et Pentaho Metadata Editor arrivent en fin de carrière. Il suffit de regarder d’un peu plus près le modéliseur AGILE-BI apparu dans la v3.7 pour comprendre que c’est désormais à partir de cette interface que l’on va désormais pouvoir créer des cubes Mondrian et des domaines de métadonnées. Je ne parle d’ailleurs pas non plus de Saïku, digne remplaçant web 2.0 de JPivot !

A suivre de près dans Pentaho 4…

Sinon, je signale juste une petite coquille dans l’ouvrage: page 176, il est indiqué que « dans la suite Pentaho, aucune interface n’est disponible pour accéder à la structure des tables ou aux données » => Erreur ! PRD embarque le même Query Builder que iReport (Jasper) à savoir SQLeonardo. Il est vraiment génial, ne vous privez donc pas de l’utiliser ! :

Conclusion :

Si vous voulez découvrir Pentaho et l’informatique décisionnelle, ce livre est décidément pour vous:  didactique, agréable à lire et très bien construit pédagogiquement, avec des exemples simples mais toujours bien choisis !

« Bien démarrer avec la plate-forme Pentaho 3.6 » aurait d’ailleurs été un titre parfait pour cet ouvrage 😉

Par contre, si vous  utilisez déjà la plate-forme Pentaho depuis un moment (Kettle, Reporting…), vous risquez d’être un peu frustrés, sauf si vous méconnaissez complètement l’un des modules (je pense plus particulièrement à Mondrian et l’OLAP…)

Si vous voulez donc creuser un peu plus les fonctionnalités de la plate-forme Pentaho, je vous conseille les livres en anglais suivants :

Bonne lecture à tous !

8 Comments

  1. Bonjour,

    Merci pour le partage de cette lecture.
    Concernant les livres existants, il y aussi celui-ci (à paraître en juin) et qui est aussi de l’auteur(e) María Carina Roldán de [i]Pentaho 3.2 for beginners[/i] : Pentaho Data Integration 4 Cookbook

    En l’achetant maintenant, on peut dès à présent avoir accès aux premiers chapitres en PDF et il est moins cher 😉

    Olivier
    P.S : je n’ai aucun action, j’ai seulement trouvé cette information sur le forum Pentaho ;-))

  2. En effet, moi-même je l’ai déjà commandé ;-).
    Maria est d’ailleurs l’auteure d’un autre livre sur PDI « Kettle 3.2 for Beginners » qui est un excellent guide d’initiation à Pentaho Data Integration

  3. Salut,
    Pour une premiere utilisation de Pentaho, penses que Pentaho Solutions soit mieux que ce livre ci? (Sans prendre en compte la langue) ?

    Car je ne sais par quel livre commencer.

    Merci !

  4. Bonjour,

    Si tu n’a jamais regardé Pentaho de près, le livre de Christian Vigouroux est déjà une première approche pour comprendre et manipuler de façon basique tous les outils proposés par la plate-forme Pentaho.
    Si tu as déjà manipulé Pentaho (PDI, rapports, …) tu risques d’être ensuite frustré et là « Pentaho Solutions » peut être intéressant, notamment sur les explications détaillées sur la partie installation en PROD et les chapitres sur l’OLAP

    J’espère que ça va t’aider dans ton choix (au pire, prend les 2 !)

  5. Bonsoir,
    Merci pour cette référence à SQLeonardo, le query builder génial.
    Il faut savoir que SQLeonardo n’est plus maintenu depuis 2009 …

    Une nouvelle équipe a repris en 2012 le développement de cet outil (qui n’est pas intégré dans PENTAHO, mais qui peut être utilisé de manière externe), il s’appelle simplement SQLeo http://sqleo.sourceforge.net/index.html

    Salutations PAscal

  6. Bonjour les amis, moi je suis un débutant avec l’outil. je veux bien prendre les deux livres. mais quel est le prix.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*