文档介绍:第卷年嚣月期计算机技术与发展..
.
基于和的异构数据集成
研究与实现
马云峰,王源
中国电子科学研究院公共安全系统部,北京
摘要:计算机网络的迅猛发展使企业内部数据交换越来越频繁,然而,系统实现技术及实现时间上的差异造成了在不同
的信息系统中存在着大量异构数据。异构数据源的存在给实现不同信息系统间数据互访带来了很大的不便。为了解决
异构数据源共享和部署集成平台过于复杂的问题,在充分调研国内外信息集成文献的基础上,基于和技
术实现了一个新型的异构数据集成平台。该平台采用文件存储元数据,部署时元需新建数据库,实现了轻量级部
署;将中介器和包装器发布成,支持多种集成平台客户端;该平台能够屏蔽网络、操作系统、各种关系型数据
库、文件的异构性,支持企业集成历史遗留数据、发布信息,并具有高度灵活性、轻便性和可重用性。
关键词:;;;中介器;包装器
中图分类号:. 文献标识码: 文章编号:———
—,
,,,
: ,,
.
.
,
.
.
; ;
, , , —
,, , .
:;;;;
引言邦数据库,数据仓库和中介集成系统】。联邦数据库
随着信息系统和计算技术的进一步发展,对数据中数据源之间使用数据转换接口来实现数据互访。在
集成有了更高的要求。各组织使用的软件系统越来越集成的数据源种类和个数限定的情况下容易实现,但
多,数据定义、数据存储格式不统一。如何检索异构的在数据源种类繁多并且经常变化的情况下,扩展性差;
数据信息,消除“信息孤岛”,为信息系统提供统一数据仓库集成将几个异构数据源的数据存储到数据仓
的数据视图,这是当前研究的一个热点。库中,主要适用于海量数据的统计分析,但是由于集成
目前集成异构数据源的体系结构主要有三种:联到一起的数据是原有数据的副本,一方面增加了存储
的负担,另一方面不能反映各异构数据源的实时情况;
中介集成系统不存储数据副本,只提供一个查询沟
收稿日期:——;修回日期:——
通的机制。当用户进行数据查询时,必须到各异构数
作者简介:马云峰一,男,河北定州人,助理工程师,硕士,研
据源中得到相关的数据,然后利用这些数据构造用户
究方向为信息集成;王源,高级工程师,博士,研究方向为信息集
成、、计算机软件等。需要的结果,主要应用于对数据响应速度要求不高的
第期马云峰等:基于和的异构数据集成研究与实现· ·
情况。展示层
文中在中介集成系统的基础上提出了一种采
用’,技术构建数据集成平
台的方案。
总体设计逻辑层
. 设计目标
在对国内外企业各应用系统运行中存在的问
题和将来的发展规划对数据的需求进行深入分析
数搦层
之后,提出数据集成平台的设计目标:数据集成平
台不应直接修改或改进现有系统,而应针对现有系
统,建立独立的系统对现有系统的数据进行抽取、
转换和集成;数据集成平台应可灵活配置各种需集
成的数据源;集成框架应支持多种操作系统。
图系统架构图
. 整体框架设计
在集成框架中,需集成的数据称为局部数据源,分
分模块设计
布于各地,它们在存储方式、组织方式上各不相同。为
. 元数据库设计
了将