Pentaho Data Integration Step by Step – parte 02 – Data Grid, Generate Rows, Generate Randon Values

Data Grid

A step Data Grid permite inserir uma lista estática de linhas em um grid. Isso geralmente é feito para fins de teste, referência ou demonstração

Data grid

Opções

  • Aba Meta: Nessa aba você pode especificar o campo e seus metadados, como nome, tipo, formato, etc.
Data Grid - Metadados
  • Aba Dados: Nessa grade, você coloca os dados . Tudo é inserido no formato String, portanto, use as máscaras de formato corretas na guia de metadados.
Data grid - Data

Suporte a Injeção de Metadados

Todos os campos desta step suportam injeção de metadados.  Você pode usar esta step para passar metadados em tempo de execução.

Generate Rows

Essa step gera um número especificado de linhas. Por padrão, as linhas estão vazias; no entanto, eles podem conter vários campos estáticos. Este step é usado principalmente para fins de teste. Pode ser útil para gerar um número fixo de linhas, por exemplo, você quer exatamente 12 linhas por 12 meses.

Às vezes, você pode usar o step Generate Rows para gerar uma linha que será um ponto inicial para sua transformação. Por exemplo, você pode gerar uma linha que contém dois ou três valores de campo que você pode usar para parametrizar seu SQL e, em seguida, gerar as linhas reais.

generate_row_options
Opções da Step

Nome da Step – Este nome deve ser único na transformação transformação

Limit – Seta o numero máximo de linhas que será gerado

Fields – Onde se configura os metadados dos campos a serem criados

Never Stop Generate Rows – Esta opção destina-se a casos de uso em tempo real em que você não deseja parar a transformação em execução.  A saída dessa etapa é usada para executar tarefas recorrentes, como pesquisa de arquivo, fila, banco de dados, … (versão 5 ou superior)

Interval in ms – Intervalo entre a geração de linhas em milisegundos 
(versão 5 ou superior)

Current row time field name – O nome do campo * opcional * para o campo Data contendo a hora em que a linha atual foi gerada (versão 5 ou superior)

Previous row time field name – O nome do campo * opcional * para o campo Data contendo a hora em que a linha anterior foi gerada (versão 5 ou superior)

                                                           fonte: Pentaho

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *