文档介绍:复旦大学
硕士学位论文
保持语义的XML数据存储和更新
姓名:岳昆
申请学位级别:硕士
专业:计算机软件与理论
指导教师:周傲英
20040430
摘要关键词:琗键,标注,规范化存储,妒剑琗文档更新字图书馆、畔⑺阉骱图傻攘煊蚨加泄憷ǖ挠τ们熬啊J菪问降亩嘌处理荩芯空呙翘岢隽烁髦諼的查询语言和存储管理技术,以及存储规则、更新操作并提供相应的实现技术,具有重要的理论价值和现实意义。从上述应用背景出发,本文从半结构化数据库的角度,考虑荼旧的语义约束,基于关系数据库技术,研究荼3钟镆宓拇娲⒓际酰换等方面进行了深入的研究和探讨,提出了有效的解决方案、关键算法和技术,并通过实验证明了这些方法的有效性。本文的主要贡献和创新之处总结如下:·基于岢隽艘恢纸玐文档保持键约束地映射到关系数据库·基于莸募际凸叵荡娲ⅲ直鹨约诘愫蚗片段为不间的一一对应关系,由此可在被标注的油忌辖蠿节点的快速定位。·基于牡翟诠叵凳菘庵械墓娣痘娲ⅲ芯苛薠文档保持键约束的更新策略。通过把际成湮9叵凳菘庵械暮览担诟文档保持了一致。利用上述标注技术,快速定位更新位置,从而有效地实现了·基于莸募镆逶际结构约束和妒剑芯苛酥接在规范化牡瞪辖蠿数据更新的策略。通过把际燃转换为览怠⒍訶所满足的形匏鸱纸猓肵转换随着蚖应用的迅速发展,〈鶫晌猈数据发布、集成、仓储和交换的标准,某鱿趾凸惴河τ么戳薟技术的革命,也为电子商务的新型解决方案提供了重要基础,同时诘缱有畔⒎⒉肌⑹使得园虢峁够莸慕巧τ玫秸庑┝煊蛑校A擞行У丶庸ぁ⒎治龊莸挠镆逶际@霉叵凳菘庥行У毓芾鞽文档、保持语义更新菔抢┱瓜钟蠿数据处理能力的重要方面,因此定义挠镆濉墓娣痘叵荡娲ⅰ范式,研究荼3钟镆宓母录际酢6莸墓娣痘娲ⅰ文档标注技术以及荼3旨际母中的方法。实现了牡翟诠叵凳菘庵械墓娣痘娲ⅲ跎倭薠数据的存储冗余,避免了操作异常,为保持键约束的更新奠定了基础。同的粒度。提出了莸男滦捅曜⒓际酰⒘斯叵凳莺蚗节点之新牡凳保坏ū3至薠文档本身的键约束,还使关系数据库和牡当3旨际母隆8碌氖迪质沟肵成为一种更加通用的数据表示及共享格式。技术进行被更新文档的规范化,以及更新后牡涤没油嫉淖;弧
瓺琗琣/琗產甅,琖甒,琗瓸.,·—琲琣琣,甌瑃琲,瑂,瑄瑃琧...琩甌.●·
,瑂母,,,:琗琣琻琗,瑃甌●,瓸甎甀...
·迪至四谌荨⒔峁购捅硐秩叩姆掷搿N牡道嘈投ㄒ第一章前言蚪的标记则明确指出了数据的含义,描述的是数据本身,使坏枷噶6鹊腦数据綛语言业已逐渐成为互联网信息的主要表示和交换工具。早在的结合起来。这种后来成为挠镅约坛辛薙娣兜暮芏嗵匦裕将精力集中在简化已有的成果上。已经提供了一种可以无限扩展的语言,它允许任何人们能够根据自己的需要加以扩充。砸=蟂<化。很大程度上出于易用性的考虑:人们对标签的读写过程应该是使用现有的简便而通用的工具,同时也应当简化计算机对文档和数据交换的处理;另外,这样的文档应该被人方便地理解。由于太多的强大功能,变得过于繁复,以至于很难编写出针对这种语言的通用解释处理器,而慕馐痛砥髟蚰芄槐较方便地实现,这正是得益于镅缘募虻バ浴4送猓琗使得现有的协议和软件的协作性更好,从而简化了数据的处理和传输。作为一个语曜⒌氖萑匀豢梢栽谡庑┫低持惺褂茫;赟男幸到谑×舜罅·虻ィ晕颐枋銮乙子诮馕觥J沟肵具有机器可读性,任何应用均可按照各种方式解析、过滤、重构牡怠·中的标记是固定的,不能扩展,而谋昙怯捎没Фㄒ澹以任意地加以扩展。那短捉峁箍梢员硎鞠质凳澜缰懈髦指丛拥亩韵笫堤濉据,这使得浅J视赪信息的发布、转换和集成。·中的标记表示的是数据的显示格式,而不包括任何语义,而户可以通过床煌南允痉绞较允救ú炕虿糠值腦文档内容。在工业界,苑⒉家岳词艿搅烁鹘绲墓惴汗刈ⅲ┱沟谋曜⒂镅裕当时的工作重点是期望将牧榛钚院颓看蠊δ苡胍丫还惴翰捎而且导噬暇褪荢囊桓鲎蛹4覵胧质沟酶蒙杓菩∽槟芄言的子集,贡3至硕韵钟械拿嫦騍低车南蛳录嫒菪裕庋的改造费用,同时与慕岷弦彩沟盟歉阌诒环梦省与相比,哂行矶嘤诺悖以及它们之间的关系,应用中各种格式的数据都可以比较容易地转化为处理、基于内容的焖鞒晌?赡堋枋隽宋牡抵性K睾妥釉K丶涞那短捉峁梗煌挠第章前言
胧菘饧际推出了支持牟如:对纳钊胙芯俊A:瞎鸩郊哟笾贫┤蛐訶标准的力度,它的/隣组织共同发展了8鞲鲂幸等缃鹑诨埂⒑9亍媒体产业正制订各自行业的,以利于数据以公认的格式交换和集成。曛贫薠的标准,启动了整个肪诚碌男畔⒈曜蓟相关技术标准的制定大大促进了疻的发展。当前,迅速发展,成为了畔⒓伞⑵笠涤τ眉伞等电子商务应用的新型解决方案和运作模式;饩隽薎隙喔鱿低骋旃埂荳服务的建模、描述、发现、发布、查找等基本操作的载体,也是相关标准协议所采用的语言鏦。竦墓惴河τ帽亟传统关系数据库存储的数据是高度结