Veja como conectar ler e escrever dados das planilhas do Google (Google Sheets), utlizando o Pentaho Data Integration (PDI).
*Atualizado em 03/02/2021
O plugin utilizado anteriormente foi desativado, por isso informo uma outra opção que testei.
Introdução
Fala pessoal, blz?
Hoje trago um simples experimento de integração do Pentaho com as planilhas do Google.
Plugin
Em minhas buscas pelo Google, cheguei neste plugin: https://github.com/GlobalTechnology/pdi-google-spreadsheet-plugin
O arquivo esta no GitHub, mas caso tenha alguma dificuldade salvei uma cópia no meu Google Drive (versão de 20/07/2020): https://drive.google.com/file/d/1knkJFxshysSaDCd0X-QuEoMmd3xhpchl/view?usp=sharingFaça o download, e para utiliza-lo, descompacte o arquivo na sua pasta de plugins do Pentaho, no meu caso o diretório é “C:\data-integration\plugins”, e caso esteja com o Pentaho em execução, reinicie ele.
A versão acima foi descontinuada utilize o “Pentaho Google Sheets Plugin APIV4” disponibilizado no Marketplace do PDI.

Reinicie o PDI, e ele deverá aparecer na barra lateral:

API Google Cloud Platform
Agora, talvez seja a parte mais “chatinha” do processo, caso você não tenha experiencia com criação de API’s na plataforma Google Coud. Para que o Pentaho possa comunicar-se com as planilhas, é preciso uma Conta de serviço e uma chave privada para autenticação.
Para isso, acesse: https://console.developers.google.com/projectselector/iam-admin/iam
e clique em CRIAR PROJETO;

Defina um nome pro seu projeto, e preencha as demais informações caso você as possua, e clique em CRIAR;

Após a criação do projeto, clique em Contas de serviço, e em seguida CRIAR CONTA DE SERVIÇO;

Defina um nome para sua conta, e preencha os demais dados de acordo com a sua necessidade;

Defina o tipo de permissão que esta conta terá;

Na última tela, caso necessário preencha os campos, senão clique em CONCLUIR

Após a criação da conta, salve o e-mail criado, e clique no botão de opções e em Criar chave, para criarmos uma chave privada de acesso que permitirá o acesso do Pentaho ao serviços do Google;

Na próxima tela, selecione a opção P12 JSON, e clique em CRIAR.
Faça o download do arquivo que será gerado, e guarde-o pois usaremos ele dentro do Pentaho.

Teste de integração
Agora que já possuímos o plugin instalado, a conta criada e configurada no Google Cloud, vamos testar a conexão. Crie uma planilha qualquer, e compartilhe com o e-mail da Conta de serviço criada;


Dentro do Pentaho, adicione a transformação “Google Spreadsheet Input”, clique em Browse para selecionar o arquivo da chave privada baixada, e clique em Test Connection.
Se tudo estiver certo, aparecerá ao lado a mensagem: Google”Success!”.

Na aba seguinte, “Spreadsheet” você consegue selecionar a planilha e a página desejada;

E na aba “Fields”, clique em “Get Fields” para trazer as colunas localizadas na planilha;

Abaixo segue o log com o resultado da transformação:

Para fazer o Output em uma planilha, o processo é bem semelhante, somente atente-se para preencher corretamente os dados da Conta de serviço.
Conclusão
Mais uma vez, o Pentaho Data Integration (PDI) mostra-se muito versátil na integração com diversas bases de dados, e com isso, ganhando cada vez mais espaço no mercado.
Espero ter sido claro e ajudado de alguma forma. Caso tenha alguma dúvida, comente abaixo e assim que possível responderei.
Obrigado pelo seu tempo, e fique bem!
Fontes:
https://datamansamxiao.wordpress.com/2019/09/11/using-pentaho-data-integration-pdi-to-connect-google-sheets/
http://blogs.ambientelivre.com.br/marcio/acessando-documentos-no-drive-da-google-com-pentaho-data-integration/
7 respostas em “Conectando Pentaho Data Integration (PDI) com as planilhas do Google (Google Sheets)”
Eu faço o download do arquivo, jogo nos plugins do Pentaho, mas não identifica o plugin novo. O que faço?
Fiz uma pesquisa rápida e parece que esta versão do Plugin que utilizei foi descontinuada.
Testei a versão disponibilizada no marktplace do Pentaho e deu certo.
—
Para baixar acesse: Tools > Marketplace e pesquise “Pentaho Google Sheets Plugin APIV4”.
Baixe e reinicie o Pentaho.
—
A única diferença que notei, foi que a chave da conta Google ao invés de utilizar P12, utilize em JSON.
—
Qualquer dúvida me chame no LinkedIn. Até mais!
Buenas.
Eu testei com aquele do Marketplace também e deu certo, só queria testar outro tipo de autenticação pra ver se dava, por que a API do Google Sheet e Google Drive permite gerar o arquivo em formato P12 também.
Mas deu boa, muito obrigado, Erick!
Abraço, meu amigo.
Ah sim saquei, show de bola!
Abraços!!!
Ola!
Segui todos os passos e a conexão deu certo. Porém na aba Spreadsheets, quando clico em bowse ele da um erro:
“access not configured, drive API has not been used in project, before or it is disabled”.
Sabem o que poderia ser?
Boa Noite Erick, ótimo material, obrigado por compartilhar.
Eu não conseguir escrever na planilha, pelo objeto spreadsheets output. Nos parametros do objeto consigo conectar, e realizar o teste conexão, a key o worksheet id são reconhecidos, mais não consigo escrever. No tutorial você cita sobre atentar-se para preencher corretamente os dados da Conta de serviço. Voce pode ajudar?
Olá!
Precisei ativar o google drive api e o google drive sheets.
Funcionou!