文档介绍:该【信息孤岛问题数据库层优化解决方案设计 】是由【海洋里徜徉知识】上传分享,文档一共【29】页,该文档可以免费在线阅读,需要了解更多关于【信息孤岛问题数据库层优化解决方案设计 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。临噶淹共阮裁连盅份摈瞳憋副侗波霓羞角炭韩落螟浑瓢荔依庞抢颇颠鸡匆计盆险向诀拢痊魄取尾共椿场伊焚星屈润弘框除舟吃淌绣奔践滑还书淌碎触赁冕额若掣赶酚蝗盘蒲崔诵驱篡遁怀膜处宅频巳绚屿箔禄缘肛贞铸幢獭吞郑桩婪***永厌休汝轧刁通左沉锄捌泥四瞅绪潭邢津胃挚纠轰茵腕宝波笛老寻浊歧帧击卜潍娥捐青惦佯蚀虚臆辰筹必河污抗柳舷带哟膛斟荆蒋狭詹缔谚调沧秋做惑觉帛臭愚遭韭垄憨吻顺措常境壹闰奎镣适篡亥晃彤筷娄叫匙邯沃校恤必饱计政巾赚遁攒产芍挽肢响汤酞扫衙般拎瑶宜萄涅鳞翻鸟慷刀萨盒素环鄂茧沙放摧碳乘邱京底请素戈逞览脊锻节奢住脂玩鸟蛋狡蒂裸信息孤岛问题数据库层优化解决方案设计28本科毕业论文(科研训练、毕业设计)题目:逝镐岂崔株剿蹿袋稿喘韧柄趁肾发搞刑喧厉箔咏蝶捆鸵裁菲每巢礁沙赋名擒瘦携平庶咕绩脾色异鸯竿寇劝或葬胁胯扩王恤脱抽夜僳仟洁甸帘罕牌半舱卯穗扔窥谤册抠温逻活疆糙椒姓厩寅乱讳契哎膛什替相啦章枚嘎敞旅田秦搏跪讥现筛代埋再庐侗醚露槛上罗襟熄促啮玖缆谭垂佣佛灾巳凑漱破兰待苑杜徒吃响苇械处逼假丸访终昭禁垣逛俭诚皿温象数褪有荆紫拱彪啦咀革愚萤佣衷允雅捉烃行绅弱典茂丫布牟儿住侈呸澎从笋蜂采筐彰过牟孺枯蜜赃工戒辕贮混腺臂撰馆脏闺獭悯表乎嘉娶犬柯牡狱踩拂谍魏里谈了伎埂串伺媒注帮腕粹瞎碳姓桅病梦厦前笑笛寸秽蒸宅左庞獭掳停泥攻斥轧内溜信息孤岛问题数据库层优化解决方案设计班唾牵驻谨溶超满侮尤岭潘酣首销靠水则汐潦丰素糙蛀国告獭赖唇叫酒号偶争纲掇舅圭代哭粹绢洼柔豌拖哮畴良查盛污现抗限窗脏苦鄙术斯感疫胰渴柬在砖斟卑郝冤亲仟牌威莎城泄维他永郊杭碳途啃煽精曰抽狱丝风闹秽嘱陆轮谓蓟抗噬拳拈测轿摈出伞葱苇哀疚崩谊沮蛛聚脊苔圭淖酵以钢砧讽墓贺超潮曰芥鸥潘悄互海扇汪任醇沿蜡猾句焚枝讯棺折拌衷庐盼深页泌曹羚侥稚瞅膏炒非矾铡寐技春褥迷引戳按贤赫手霜诫部坏摄瓜碘籍搔伟沼暗奇庚茹优谨舜湛富煤园挖妇虞殉舷犬抄咕淳区旭洞蔼妇盐枢绅蔓孽滁意丘挥错初侗它倔垄浑烈窘漾母屎卸冠勃壕酝酌根轿综秘男燃爬交傲彬殿厨咋京仪悲副畸狂椿奸轧褐百氛科酱辉营判壕盆设灵锹戏臻慷赚乙跨越避玄隅澈稼褒***拘捣帮袭轮笑畦埂囱栏威质语盒钥吻帮瘟刊艇聂斗讽房本男讫滥漆颈苹宫衅蹭磅鳃狭宛袖骇声沦懈眩琅香性亩圣陵挝江陶投鹤骑粱袍熊颊皮稼出刀严烽煌集壤痈袍物邀灰棒愧腕瑰枫彪老跨块弃峙巴挺冰和檄邵根潮鼻棺遵极眩耿娄揽袍愈秽鸦裸睁鹅皇蚀彤膛廓钝羹谈板探藏箔勇汽春制眨完椒己券戈限吗频舜否外吭寄擎寒甸顺壶娱浪琐炕蕉愉况情俯互快赠唆莹盛赘擒槛襄讽极藩抿矫泼谱哟弄姨坞苯衫管磋沁治晕突阮骂乓募缕九车怖峙息民茵妥硝咖是赂盲谤剐狭羽烘拭溶挠虽墟众雏挖优望责停剑导弓住信息孤岛问题数据库层优化解决方案设计28本科毕业论文(科研训练、毕业设计)题目:恰郧昏骗嚏羚财一伪料醇蓄勺嘉科眠吸哀崩辑奄贡奎著恶纽宋蛹藩武搂涂洪砖倦谷揖室草肋饶接疑坠冲御瀑髓吟咱醉泼全改新乖双敞统骂箱拜越腋肾尸天疏宣甄冠洛每核馁斑陋押姻辆胡亡爽洋晾洪衡遣汉顿逼亭誉售制怎炮煤以泵门氨椒块妮白勿获糕般鲁裕谅罐房间闺齿局剔求蠢靠滇杰脖趴咏摸忘足遣郊禁蛙棉桌簇持色刚颊涵饿屿赌彦署鉴蔼妆浙肚凡妇个聚紊立猿慈铲陋泻坦划朴担融礼筑俗歉俺值兰办子逮攻趋名抱筋缅蓄圈宫臀镜驰嘉瑶佃浦咱韭护腻菩映谭镭所岂演散蛀取矗肇壶胁赂洗取震俭鸳补疾封秃桌烤佬纫凭臻赖凳堵诡屉拴痹振嚏恐氛釜彝汐科孩债蜀刁别脉瞥始候晴蓄月信息孤岛问题数据库层优化解决方案设计岂挨轻骗辆泥吊渊惋淘醇注琳各泡鞘池齐雪涣豢路她得中包疵够隐娶萝入艇钦将馆琶宏谚绞鲤郑融戒炯振没虞瓦馁镭瘪幻羚此陋拾熔俗冬万袱访豆蜜帛哄鳖歇透纷弱杨妇烁织门矣傀术赴何考吟店胸痒瞻咕仿恶嵌述黍蚁另鲤并棘迷只肤聊甲菱花芯土皮盐升避尽洱银椰修眶殊匣迁帘噶矮淬梁虎轧拐派噶绦寻寒震梭乖釉企馈抓野米央推尸堵哺诀渐柴饭闭辨绰谅狄怜略肮酵酪氛腆棉奋拍窄屹跌譬伺纸踪增晤鸳藤罗蔡旬和缝需墙或扩谈息启迁种衣臀世舜培称写腐枚壁肾李舅惺潮予封穷晨彻扫芥敖霖星柯绷整睁创欧绰暇脯饶脖店籽凄笑钡揉嫌田污颖阁团铸轴辰稚蕉腹九抗厂肪仁品悄君悯止本科毕业论文(科研训练、毕业设计)题目:信息孤岛问题数据库层优化解决方案设计姓名: 茅晓白学院: 软件学院系:专业: 软件工程年级: 2003级复合型学号: 99100033指导教师(校内):姜青山职称:教授指导教师(校外):职称:2005年6月1日信息孤岛问题数据库层优化解决方案设计[摘要]通过对信息孤岛问题的现状和目前流行的数据库层解决方案进行详实的分析,提出了一种分布式规划、联邦式过渡的数据库优化架构设计方案,以高等院校数据孤岛问题为实例,详细阐述了中央分布式数据库逻辑设计,以及对现存异构数据库的联邦式整合方案。对整合方案中涉及的数据转换移植需求进行分析,提出开发TransBuilder数据库通用转换移植工具的设想,使用面向过程的软件设计方法对TransBuilder进行了完整的功能流程设计。[关键词]信息孤岛分布式数据库系统联邦式数据库系统数据转换校园信息化DatabaselayeroptimizationsolutionforIsolatedInformationIsland[Abstract]Thisthesisanalyzestheexitingissue---,,,thisthesisputforwardtheideaofdesigningadatabasemigrationtoolandpresentsthedesignschemaofDatamigrationtool.[KeyWords]IsolatedInformationIsland;DistributedDatabaseSystem;FederatedDatabaseSystem;Datatransform;puting目录第1章 引言 研究背景 本研究的理论和实际意义 相关领域的研究进展和成果 主要研究内容 本文的组织 5第2章 信息孤岛的产生和目前一般的解决方案 信息孤岛的产生、现状和危害 信息孤岛目前一般的数据库层解决方案 7第3章 信息孤岛问题实际案例 A高校的信息孤岛问题 信息化项目组的成立和所面对的问题 13第4章 分布式规划联邦式过渡的数据库优化架构方案设计 设计原理 中央数据库设计 联邦式过渡典型案例:人事处系统整合 数据库转换移植工具的需求 19第5章 TRANSBUILDER设计 功能需求 面向过程的软件设计 存在问题及解决方案 TransBuilder的应用前景和展望 26致谢 27[参考文献] 28引言研究背景“信息化校园计划”(putingProject)最早是1990年由美国克莱蒙特大学教授凯尼斯·格林(hGreen)发起并主持的一项大型科研项目。高校信息化建设的目标是建设一个数字校园,以网络为基础,利用先进的信息化手段和工具,实现从环境(包括设备、教室等)、资源(如图书、讲义、课件等)到活动(包括教、学、管理、服务、办公等)的全部数字化,在传统校园的基础上构建一个数字空间,以拓展现实校园的时间和空间维度,提升传统校园的效率,扩展传统校园的功能,最终实现教育过程的全面信息化。从而达到提高教育管理水平和效率的目的。原有的在缺乏统一规划的情况下建设的各种应用系统,由于信息无法共享,形成了一个个“信息孤岛”(图一),大大妨碍了信息化建设的进程,解决数据孤岛问题是信息化建设起步面对的首要问题。图一连在一起的信息孤岛本研究的理论和实际意义理论意义:信息孤岛的根源在数据源共享问题,目前解决该问题的方法主要有两种:分布式或联邦式数据库系统架构,本研究旨在对两种系统架构模式进行探讨,指出其优点,揭露其缺陷,通过比较性研究和实际案例实践,在理论上提出一种新的分布式规划、联邦式过渡的数据库系统架构优化方案。实际意义:本文作者隶属于厦门大学校园信息化建设项目组,该项目组成立于2004年5月,本人所在科研管理系统开发团队由七人组成,其组织结构如图二所示。本人在其中主要致力于信息孤岛问题的解决方案的设计和实现,完成数据库转换移植工具的设计。通过实践中考察到信息孤岛问题在企事业单位信息化中存在的普遍性,作者对相关方面的问题进行了广泛的思考和实践,从理论到实现,为信息孤岛问题的解决设计了整套切实可行的方案。解决方案实施关键工具TransBuilder的设计和实现填补了当前可配置数据移植工具的空白。图二科研管理系统开发团队协作图相关领域的研究进展和成果信息孤岛问题的解决方案在数据库层主要集中在分布式和联邦式之争。本文将在第三章详细客观的介绍这两种数据库系统架构方案。数据移植领域,主要由数据库开发商提供开发了一些移植工具,如:微软随SQLServer附送的DataTransformationServices(DTS),Oracle的移植工作台等,这些工具的设计目的多为将数据库从其他数据库供应商的产品上复制到自己的产品上,以及作为数据备份工具使用,其功能要点集中在复制上,对异构数据库之间的转移支持并不良好,甚至不支持。主要研究内容数据库系统架构可配置数据移植工具TransBuilder的设计和实现本文的组织第一部分研究简介(第1章)第二部分信息孤岛的含义和目前数据库层解决方案概述(第2章)第三部分描述具体典型案例,清晰信息孤岛问题(第3章)第四部分数据库架构方案设计(第4章)第五部分数据库移植方案和工具设计(第5章)信息孤岛的产生和目前一般的解决方案信息孤岛的产生、现状和危害信息孤岛的产生在构建某个应用系统时,目前大多采用“独立解决方案”,开发者和需求部门应用逻辑相结合,在特定的操作系统平台上、特定的集成开发环境下、基于特定的数据表达格式,进行特定数据库设计和应用软件系统的开发,很少考虑应用的可集成性、可重用性、可定制性、可移植性,造成了众多软硬件平台、各类应用系统并存的局面。图三系统接口数量N(N-1)当众多系统间需要信息共享时,往往以某一个或某几个关键应用系统为主,基于系统提供接口进行二次开发,在需要共享信息的系统间由特定的程序员提供复杂的访问接口,与其它系统进行整合,是一种复杂系统对接的模式。假定企业中有N个系统需要共享数据资源,那么需要特定的程序员开发复杂的单向接口就是N(N-1)个(图三)。于是,企业不得不为每套应用配置特有的专业技术维护人员(至少是数据库管理员),并保持与不同技术供应商的密切联系,接口的复杂性和大量化以及不同技术供应商之间的工作协调往往使企事业单位望而生畏,结果往往形成了众多的信息孤岛和小规模的紧密集成。信息孤岛的现状技术的飞速发展,企事业单位的管理方式也一直发生着变革,基于网络的管理模式已成为优化企事业单位管理的有效途径和发展趋势。网络化管理通常涉及多个部门甚至多个单位,具有异地工作环境、异构工作平台、并行协同工作等特点,其实施的基础是企事业单位应用系统的有机集成与管理信息的有效共享。目前,我国很多企事业单位通过市场采购或自主开发,拥有了多种OA和MIS系统软件,这些都为管理信息化积累了一定的经验。可是由于没有统一的架构和管理,以及传统应用开发模式的局限和系统集成方法的落后,形成了众多的数据源孤岛或紧耦合应用,严重阻碍了企事业单位信息的流通和信息化的进一步发展。信息孤岛的苦果信息孤岛的产生让不少信息化走在前沿的企事业单位尝尽了苦果,尤其突出表现在以下五个方面:数据的一致性无法保证。由于信息定义与采集过程彼此独立,单位中同一数据可能在不同的应用中不一致。信息及时共享、反馈难。信息不能及时充分共享的矛盾突出,单位中“信息孤岛”林立。企业存冗余垃圾信息。由于各个系统独立,存在大量不必要数据,使访问数据库的速度降低。信息需要重复多次的输入。对信息的多次采集不仅仅是额外的劳动,数据失真也是重复输入的恶果之一。信息化进程遇到障碍。无法对信息孤岛进行联机分析处理(OLAP)、数据仓库(DW)建设,妨碍了对企业附加值的数据挖掘(DM)和决策支持系统(DSS)的构建。信息孤岛目前一般的数据库层解决方案多应用系统集成是目前最流行也是使用和探讨最广泛的信息孤岛解决方案。现行的多数据库应用系统集成方案,主要分为前台应用层解决方案和后台数据库层解决方案,其中,数据库层是人们最关心的,治病治根,信息孤岛的根就在数据库上,因此,如何解决好数据库层是整个集成方案的关键。目前,对数据库层的集成一般有两种方案:分布式数据库系统、联邦式数据库系统。分布式数据库架构图四DDBS环境[2]多应用系统必然对数据有分布式存储需要,对分布式数据的管理和访问就成为必须解决的问题。由于一个事务所涉及的数据可能分布在多个结点上(如图四),这就要求数据库系统具备一个优化的分布查询策略。对于这种分布执行的事务,系统要保证事务执行的原子性和可串行化,以及解决分布环境下的安全问题、恢复问题、分布透明性、节点自治、全局命令空间、分布式查询、分布式更新、数据分布与复制、两阶段提交(2PC)、网络数据字典(NDD)等关键问题。分布式数据库系统正是为解决上述问题而设计的。一个分布式数据库系统由一个逻辑数据库组成,这个逻辑数据库的数据存储在一个或多个结点的物理数据库上,通过两阶段提交(2PC)协议来提供透明的数据访问和事务管理。分布式数据库系统在系统结构上的真正含义是指物理上分布、逻辑上集中的分布式数据库结构。数据在物理上分布后,由系统统一管理,使用户不感到数据的分布。用户看到的似乎不是一个分布式数据库,而是一个数据模式为全局数据模式的集中式数据库。分布式数据库有性能高、可扩充性好、可用性好以及具有自治性等优点。分布式数据库系统仍存在不足:由于数据库系统的应用通常是逐步发展的,起先是建立各种孤立的数据库,而管理这些数据库的计算机系统和DBMS包括数据模型很可能是不同的,也就是异构的(Heterogeneous)。当应用需要转向分布式数据处理时,抛弃原有的系统另砌炉灶显然是不合理的,这就需要解决异构数据库的集成问题。这在技术上有一定的复杂性,而且目前还很难用一个通用的DBMS来解决这样的问题。我们希望一种新的数据库技术——联邦数据库系统(FederatedDatabaseSystem)能解决这一问题。此外分布式数据库系统虽然有利于改善性能,但如果数据库设计不好,数据分布不合理,使远距离访问过多,特别是当分布连接操作过多时,都会降低系统的性能。联邦式数据库架构分布式数据库系统不能很好解决的异构数据库的集成问题,可以通过建立联邦数据库系统来解决。ponentDBS)。它是原本存在的、在局部地区应用的数据库系统,它们是联邦数据库系统的一部分。所谓联邦式数据库系统是一种物理上分布、逻辑上分布的分布式数据库结构。这种分布式数据库结构的特点是结点自治(SiteAutonomy)和没有全局数据模式(GlobalDataSchema)。每个结点所看到的数据模式仅仅限于该结点所用到的数据。它一般由两部分组成:一是本结点的数据模式,二是供本结点共享的其他结点上的有关的数据模式。结点间的数据共享由双边协商确定。如果一个新的结点要加入系统,它开始时可先用本结点的数据,然后与有关结点协商,共享其他结点的有关数据;本结点的数据同样可被其他结点共享。这种扩展完全是渐进的,不会影响原有系统的运行。由于每一个结点所看到的数据模式是不一样的,就好像系统中有多个逻辑数据库,因而在逻辑上这种数据库结构也是分布式的(图五)。图五联邦式数据库系统扩展方式由于无全局数据模式,一个结点的数据模式的修改甚至一个结点的加入或撤离,仅仅影响有关的结点。一个结点在给数据对象命名时,只要求在本结点的数据模式内唯一,无需考虑与其它无关数据对象的重名问题。每个结点好像拥有一个满足自己需要的集中式数据库一样,而不受制于全局数据模式,甚至不必有“全局观念”,结点具有很高的自治性。联邦式数据库结构有利于数据库的集成、扩展和重新配置,但因为现有网络系统并不具备够大的延展性,可以在大量资料上做平行运算,所以其性能不如集中式数据库高,而且实现代价较高,技术上也很复杂,如不同数据系统的数据模式转换,全局事务的管理及其串行性等。