Jusqu’à présent, toutes les fonctionnalités de Kettle destinées au BigData étaient disponibles uniquement dans la version Enterprise de Kettle (payante) :
Pentaho a fait hier une annonce d’importance qui mérite d’être signalée : tous ces composants sont versées dans l’open source dans PDI 4.3 !
Cela signifie qu’on peut maintenant utiliser librement les étapes de jobs et transformations liées au BigData: Hadoop, Cassandra, HBase, HDFS, MongoDB, Amazon EMR, Pig…
Spoon devient une interface idéale pour le développement de tous vos traitements BigData/MapReduce (fini le code spécifique…)
Cette vidéo devrait vous convaincre :
On notera aussi au passage que PDI change de licence pour passer de la LGPL à la licence Apache 2.0.
Voilà qui est synonyme d’une intégration plus facile de Kettle dans des applications tierces.
=> Retrouvez plus d’informations sur le blog de Matt Casters et sur le wiki de Pentaho