Pentaho Data Integration – Remover linhas duplicadas

Como remover linhas duplicadas dentro de uma tabela.

  1. Organize suas linhas utilizando a step “Sort rows”, usando como referência o campo que deseja “desduplicar”;

2. Em seguida adicione a step “Unique rows”;

3. Selecione seu campo de referência em “Fieldname”;