文档介绍:中山大学
硕士学位论文
分布式数据库数据同步系统的设计与实现
姓名:于大庆
申请学位级别:硕士
专业:软件工程
指导教师:周青
20061202
摘要上关键词:分布式数据库,萃数据同步是分布式数据库间维持数据一致性的~种手段,本文针对目前各类流行数据库的特点,提出了适合于企业级数据同步的解决方案。首先,利用的触发器和存储过程实现数据库变更日志的实时获取。然后,构造当前数据库的元数据的模式,并建立元数据与间的映射,将变更数据表示成问健T偈褂茫甆的技术完成系统问莸拇输。最后,根据目标数据库的元数据与的映射将募械氖转化为目标数据库可用数据,从而较好地解决了分布式数据库数据同步问题。论文题目:专业:硕士生:指导教师:分布式数据库数据同步系统的设计与实现软件工程于人庆周青
、分布式数据库数据同步系统的设计与实现.,瑃.::,甆瓼,.
第综述背景网络技术的飞速发展和广泛应用,特别是因特网的普及,大大方便了企业的跨地域发展。同时,为了适应不断增长的商业竞争环境,许多企业通过不断重组和分散经营来提高效率,形成了分散、异构的环境特点。同时这些组织在地域上虽然分散,但在管理上相对集中,往往既要有各部门的局部控制和分散管理,也要有整个组织的全局控制和高层次的协同管理。这种协同管理要求各部门之间的信息既能灵活交流和共享,又能统一管理和使用。分布式异构数据库资源处理被普遍认为是世纪人类的工作方式。分布式侵阜植荚诓煌乩砦恢蒙系氖菘庾试矗些数据库资源可能存在操作系统的差异,也可能存在数据库管理系统的差异,也可以是数据库内部表结构的差异。当前,分布式数据库技术已经成熟,并且因计算机成本的下降以及通信费用的降低而得到了广泛的应用。然而,分布式数据库系统既要提供局部自治又要实现全局控制,带来了很大的挑战性。如何在不同组织之间、不同类型、不同平台的数据库系统之间进行数据同步工作,正成为分布式数据库领域内的一个热点研数据库究问题。分布式数据库数据同步系统的设计与实现
现有技术分析目前,分布式数据库计算主要有以下三种实现方式ň质萸蚍侄喂芾怼6苑植荚诟鞲鼋诘闵系母髦质菘舛冀⒂户交互接口,不进行任何模式的集成。各个成员数据库对全局数据进行区域分段管理,对本区域以外的数据操作则通过远程登录方式进行。此方案简单易行,但用户无法透明地访问数据,且当增加一种新的数据库节点时,必须增加用户接口,实现方法比较繁琐。赬中间件的分布式数据源集成。具体方法是,建立一个通用数据库中间件,通过在系统业务逻辑、通用构件服务缡挛瘛⒚帧踩ǖ和数据源之问建立一个中间层,对服务层屏蔽数据源的差异。中间件向服务层提供一致的数据视图,完成从实际数据源到用户数据视图的转换,并在中间充当数据总线。此方案的优点是:实现了数据访问的透明性,并且采用此种数据集成策略的系统具有可扩展性,可以实现数据源的”即插即用”,这是相对于传统的数据同步技术的一大优点,大大减少了后期系统维护的成本。但是,此方案的局限性也很明显。首先,因为要建立统一的用户数据视图,因此对数据源中数据的内部关联性有一定的要求。数据源局限于一个行业、行业局部或者一个企业的内部。其次,因为在数据集成策略中多了一个中间层,数据源和湫枰=兴虻转换运算,这就意味着当多个分布式数据库同步时,这个模型的效率就比不上传统的数据同步的模型,整个系统的性能必然会有所降低。此种方案适合于企业门户等方面的应用,但是对于数据实时性要求较强方面的应用就显得有点力不从菘飧粗萍际酢2捎梅植际绞菘庀低辰峁梗锢砩戏植级呒上相关的数据库通过分布式数据库系统进行管理。系统具有独立性和透明性的特点,用户对任何数据库的操作都如同在本地进行,不必关心其数据模型、物理位置等细节。现有的流行数据库产品都提供了自己的数据库复制解决方案,而且产商大多提供了一些辅助工具可以协助用户更好地完成复制任务。这种解决方案在一心。分布式数据库数据同步系统的设计与实现
运行性能和整体性方面都有着明显的优势。例如,技术途径是采用出版、订阅、复制代理来进行多个数据库之间的数据一致性维护。这种解决方案的局限性存在于以下方面。首先,数据库产商提供的复制方案依赖于产商自己的核心关系紧密的实现技术,不一定适用于其它,也就是说在不同厂商之间的数据库实现同步复制难度很大。其次,这种方案要求在各成员数据库之上建立一个全局模式,对数据库实施统一的管理。该全局模式由所有成员数据库模式集成,若数据库内部表结构存在差异,建立这个全局模式则会相当困难。最后,复制是在两个环境之间复制全部或部分数据库的过程。为了保持一致,对源数据库所做的更改要传播到复制的数据库中。复制可以是单向的,也可以是双向的。双向复制可能更困难一些,因为对任何数据库所做的更改都可能产生不一致的数据。当这些更改在两个数据库之间传播时,需要