Como instalar o Pentaho Data Integration (PDI) no Windows

Um breve tutorial, com todos os passos básicos para instalação do Pentaho Data Integration no Windows.

*Atualizado em 22/08/2020

Introdução

Fala pessoal, tudo blz?
Resolvi criar um rápido passo a passo, mostrando como instalar o Pentaho Data Integration no Windows. Sempre tive muita dificuldade em achar um tutorial que funcionasse 100%. Por isso, estou disponibilizando para todos o processo que tenho utilizado em meus trabalhos.

Download dos programas

Faça o download de todos os arquivos abaixo:

  • Pentaho Data Integration 8.2 CE (Community Edition)

    A versão do Pentaho que utilizo neste tutorial é a 8.2 CE (Community Edition), é a versão estável no momento deste tutorial. Se preferir utilizar uma mais recente, você pode encontrar neste link Pentaho from Hitachi Vantara,
  • Java JRE 8

    Estou utilizando a versão 8 Update 241, mas acredito que a mais recente deva funcionar.
    Neste nosso caso, selecione a versão para Windows.
  • 7-Zip
    7zip logo
    De acordo com alguns profissionais, é preferível a utilização do 7-Zip para descompactar os arquivos do Pentaho, pois já foram registrados erros na execução do programa utilizando outros descompactadores, como por exemplo o WinRar.

Instalação e Configuração

Atenção: Instale todos os programas clicando com o botão direito do mouse, e selecionando a opção “Executar como administrador”.

  • Instale o 7-zip, não há segredos, somente executar e avançar.
  • Instale o Java JRE, também não há segredos, somente avançar.
  • Criar variável de ambiente: é necessária a criação de uma variável de ambiente, que indique ao Pentaho o local de instalação do Java.
    Para isso, acesse:
    Painel de Controle -> Sistema -> Configurações avançadas do sistema -> Variáveis de Ambiente
    ou execute este comando no executar: SystemPropertiesAdvanced.exe
Tela para configuração de Variáveis de Ambiente
  • Na caixa de diálogo aberta, na tela de Variáveis do sistema, clique em Novo…
  • Preencha o campo Nome da variável com PENTAHO_JAVA_HOME , com especial atenção à escrita em caixa alta.
  • No campo Valor da variável, insira o endereço do diretório onde o Java foi instalado, no meu caso (C:\Program Files\Java\jre1.8.0_241) e clique em OK.
Tela para criação da Variável de Ambiente
  • Descompacte o arquivo baixado do Pentaho, utilizando o 7-Zip, eu prefiro extrair no diretório C:
    ficando dessa forma (C:\data-integration).
  • Dentro da pasta data-integration, procure o arquivo “Spoon.bat”, clique com o botão direito e abra como editar, para definirmos o consumo de memória para execução do Pentaho.
Print da edição do arquivo “Spoon.bat”
  • Dentro do arquivo, procure este trecho abaixo:
REM ******************************************************************
REM ** Set java runtime options                                     **
REM ** Change 2048m to higher values in case you run out of memory  **
REM ** or set the PENTAHO_DI_JAVA_OPTIONS environment variable      **
REM ******************************************************************

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx12048m" "-XX:MaxPermSize=256m"

Xms: refere-se ao start da aplicação, onde “-Xms1024m” indica que ao iniciar o Pentaho, será alocado 1GB de memória para utilização. *A desenvolvedora indica 55% da memória total do micro.

Xmx: refere-se ao limite máximo de memória que poderá ser utilizado pela aplicação, no caso “-Xmx2048m” indica que poderá ser utilizado até 2GB de memória durante a execução. *A desenvolvedora indica 75% da memória total do micro.

Faça a edição dos parâmetros e salve o arquivo.

  • Para executar o Pentaho, execute o arquivo Spoon.bat localizado dentro da pasta data-integration. Geralmente ele demora alguns segundos para abrir, mas aguarde até a Splash Screen aparecer.
    Se preferir crie um atalho dele para a área de trabalho.
Splash Screen / Tela de abertura

Ao aparecer essa tela, provavelmente a instalação do Pentaho deu certo, e o programa será inicializado.

Conexão com Banco de Dados

Para conectar-se com algum banco de dados, é necessário fazer a instalação do driver de conexão JDBC do banco na qual queira se conectar.

Para isso, baixe o driver referente ao banco de dados que irá utilizar, e copie o arquivo .jar para a pasta lib, que se encontra no diretório de instalação do Pentaho, no meu caso (C:\data-integration\lib).

Link do driver para MySQL (v. 5.1.49), é a versão que eu utilizo nos meus trabalhos:
https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.49.zip

Lista disponibilizada na página de documentação da Hitachi Vantara – Pentaho, com vários drivers JDBC :
https://help.pentaho.com/Documentation/8.2/Setup/JDBC_Drivers_Reference

Conclusão

Espero ter sido claro e objetivo neste passo a passo, e caso tenho alguma dúvida, sugestão, ou se consegui te ajudar de alguma forma, fique à vontade para comentar abaixo.

Obrigado pelo seu tempo e fique bem!!! 😁👍


Caso prefira o tutorial em vídeo, recomendo este feito pelo Ricardo Gouvêa, que foi uma das minhas fontes: https://www.youtube.com/watch?v=E_qeyTbRymA&feature=youtu.be&t=558