• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

沈琦 (沈琦.) | 陈博 (陈博.)

Indexed by:

CQVIP

Abstract:

针对传统抽取、转换、装载(ETL)架构在数据处理过程控制方面和数据产品开发效率方面的不足,提出一种基于大数据处理的ETL架构。通过分析主流的ETL工具--Datastage的工作原理和ETL过程的特点,设计ETL元数据描述模块、ETL任务描述模块、配置解析模块和数据任务调度模块等。使用该框架处理数据任务时,以配置文件的方式开发,使工作效率得到了极大的提升。基于该设计思想开发一款基于大数据处理的ETL工具,在对数据处理过程(E、T、L)的控制方面得到了改进,同时也可以使数据开发人员从大量重复的操作中解脱出来,将更多的精力放在数据的逻辑处理方面。

Keyword:

数据抽取 数据加载 ETL框架 大数据处理 数据转换

Author Community:

  • [ 1 ] [沈琦]北京工业大学
  • [ 2 ] [陈博]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

电子设计工程

ISSN: 1674-6236

Year: 2016

Issue: 2

Volume: 24

Page: 25-27,34

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 27

Chinese Cited Count:

30 Days PV: 15

Affiliated Colleges:

Online/Total:452/10526914
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.