Pentaho Data Integration (Kettle)

Pentaho Data Integration (Kettle)

A suite Pentaho é formada por um conjunto de softwares voltados para construção de soluções de BI (Business Inteligence), que inclui programas para extrair os dados de uma origem (sistemas, arquivos txt, csv), gravá-los em um data warehouse (ou base de dados), limpá-los, prepará-los e entregá-los a outros sistemas de destino ou mesmo a outros componentes da suíte para estudar ou dar acesso aos dados ao usuário final.​


O Pentaho Data Integration, faz parte da suite de soluções do Pentaho, e possui duas versões a Communit e Enterprise, porem as diferenças entre as versões não é um impeditivo para sua utilização.


O que é o Pentaho Data Integration?

É um componente da suíte Pentaho que fornece recursos de Extração, Transformação e Carga (do inglês Extraction, Transformation and Loading, ETL), facilitando assim o processo de captura, limpeza e armazenamento de dados usando um formato consistente, acessível e relevantes para os usuários finais.
Para quem esta chegando agora no mundo do PDI (Pentaho Data Integration), você pode se deparar com o nome "Kettle", isso porque o PDI, iniciou como um projeto de código aberto chamado K.E.T.T.L.E.  (do inglês Kettle Extration Trasformation Transport Load Environmet), quando a Pentaho adquiriu o Kettle, o seu nome foi alterado para Pentaho Data Integration.  Os outros componentes como o Spoon, Pan e Kitchen, têm nomes originalmente criados para apoiar a metáfora "culinária" e não sofreram alterações.

O que é possível fazer com o Pentaho Data Integration?

  • Migração de dados entre diferentes bancos de dados e aplicativos
  • Movimentação de grande volumes de dados
  • Transformação e limpeza de dados
  • Conformidade de dados

Modelo de uma transformação desenvolvida com PDI



Fonte: 
https://community.hitachivantara.com/s/article/data-integration-kettle

Comentários

Postagens mais visitadas