Skip to content

Instantly share code, notes, and snippets.

@arthuralvim
Last active April 18, 2016 14:06
Show Gist options
  • Save arthuralvim/e97b7d1d89fa19321c6ed81eb535a4e6 to your computer and use it in GitHub Desktop.
Save arthuralvim/e97b7d1d89fa19321c6ed81eb535a4e6 to your computer and use it in GitHub Desktop.
Falando sobre ETL...

Tópicos Importantes sobre Boas Ferramentas de ETL

  1. Conectividade com os dados

Permitir que seja possível acoplar/conectar com qualquer fonte de dados seja ela um banco de dados relacional, não relacional, uma planilha ou um webservice.

  1. Performance

Processos de Extração, Transformação e Carga costumam demorar bastante devido ao poder de processamento e I/O demandados. Estas operações devem ser bastante otimizadas e sempre que possível medidas para acompanhamento/monitoramento dos processos.

  1. Transformação

Uma boa ferramenta de ETL permite que seja possível comparar, combinar e alterar dados de maneira fácil.

  1. Qualidade dos Dados

O entendimento sobre a base de dados é papel fundamental no processo de ETL. Rotinas que prevejam a limpeza e validação de atributos são essenciais. Sem dados concisos e limpos não é possível gerar informação.

  1. Automação

Rotinas de automação são parte importante para o processo.

@arthuralvim
Copy link
Author

Adicionar exploração dos dados.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment