Pentaho Data Integration (Spoon): Um guia para novatos – parte 3

Para um bom funcionamento, em tempo de desenvolvimento, de ETLs com Pentaho Data Integration – PDI são necessárias algumas configurações.  Além das conecções com os bancos de dados, já mostradas em post anterior, uma configuração importante é a alocação de memória da JVM para a execução da aplicação.

Primeiramente vamos ao diretório de instalação do PDI, no meu caso no endereço conforme imagem abaixo:

 

Editamos o arquivo spoon.bat (windows) ou spoon.sh (linux):

spoon.bat

Ao abrir os arquivos indicados em seu editor de texto preferido, eu estou usando o visual studio code, procure pela linha que contém PENTAHO_DI_JAVA_OPTIONS, nela você encontrará os parâmetros: Xms, Xmx e MaxPermSize.

Uma pequena explicação sobre esses parâmetros:

  • Xms – define a quantidade inicial de memória dinâmica alocada no início pela JVM;
  • Xmx – define a quantidade máxima de memória dinâmica alocada pela JVM para armazena instâncias de objetos, variáveis, etc;
  • MaxPermSize – define a quantidade máxima de memória permanente alocada pela JVM.

Para saber mais sobre esse assunto, acesse esse artigo que encontrarão mais material.

Os ajustes nesses parâmetros dependem das configurações de hardware da sua máquina e do tamanho do seu projeto.  Vamos usar como exemplo uma máquina com 8 gb de memória RAM.

Alocaremos da seguinte maneira:

  • Xms – 1024m;
  • Xmx – 4096m;
  • MaxPermSize – 512m.

Essa configuração indica que partiremos de 1 Gb inicial de memória para a JVM, teremos – no máximo – 4 Gb disponíveis e 512 Mb de memória fixa para instancias de objetos e variáveis.

Com esse configuração consegue-se desenvolver trabalhos de médio porte se nenhuma dificuldade.

Já em produção, é conversa para outro post.

É isso aí amigos, qualquer dúvida, críticas ou coisas para acrescentar, deixem nos comentários, até a próxima.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *