文档介绍:・ 214・
计算机应用研究
基于数据仓库的通用 ETL 工具的设计与实现
陈
弦, 陈松乔
( 中南大学信息科学与工程学院, 湖南长沙 410083)
2004 年
摘
要: 讨论了一种基于异构数据源通用 ETL 工具的设计方法和实现过程, 它能实现异种数据源的数据转换,
并将数据装载到中心数据库中, 具有一定易用性、灵活性和扩展性。该工具根据索引库来获得目标数据库与源
数据库的映射关系。
关键词: ETL; 异构数据; 索引库
中图法分类号: TP311
文献标识码: A
文章编号: 1001- 3695( 2004) 08- 0214 - 03
Design and Implementation of General ETL Tool
Based on Data Warehouse
CHEN Xian, CHEN Song- qiao
( College of Information Science & Engineering, Central South University, Changsha Hunan 410083, China)
Abstract: In this article, design methods and implementation techniques are discussed to realize the ETL among heterogeneous
data sources based on all kinds of database. The general ETL tool with better flexibility, extensibility and capability of error
handling has efficiently realized the transforming of Heterogeneous data and loading data into center database. The tool gain the
mapping relationship between target database and sourse database according to index database.
Key words: ETL; Heterogeneous Data; Index Database
1
引言
ETL 同时提供数据质量的管理, 并且贯穿到整个商务智能解决
方案的全过程, 完成整个系统的数据处理与调度。
数据仓库中的数据来自于多种业务数据源, 这些数据源可
能是在不同的硬件平台上, 使用不同的操作系统, 因而数据以
不同的格式存在于不同的数据库中。如何向数据仓库中加载
这些数量大、种类多的数据, 已成为建立数据仓库所面临的一
个关键问题。由于不同的事务处理系统必将用到不同的数据
库系统, 包括不同的关系型数据库, 非关系型数据库, 甚至文件
系统等。如有的采用 Oracle 数据库管理系统, 有的采用 Mi-
crosoft SQL Server 数据库管理系统等, 先要建立全局的企业级
, 要求这些不同部门间做到数据共享, 实现全局数据一
致性,