文档介绍:复旦大学
硕士学位论文
XML数据索引和语义约束
姓名:吴红伟
申请学位级别:硕士
专业:计算机软件与理论
指导教师:周傲英
20040430
摘要关键字:饕镆逶际琗键,览担际成随着互联网的飞速发展,云淝看蟮氖荼泶锬芰σ约凹虻ァ⒖7判浴可扩展等优点而逐渐成为互联网上信息发布和数据交换的事实上的标准,因此对萁杏行У毓芾砗筒檠囊G笠苍嚼丛狡惹小M保髦指餮腦查询语言被提出来了。路径表达式是这些查询语言的重要组成部分,因此高效地对裕桓龉系奈侍馐牵褐挥杏锓ㄒ庖宥狈τ镆逍畔ⅰNA嘶应这神批评,研究者们提出了各中各样的语义约束。虽然丫魑J萁换的主要格式和标准而应用于各行各业,但是在实际的应用中,为了有效地利用关系数据库成熟的数据管理功能来处理荩⑶夷芄焕没诠叵凳库的应用系统,通常需要把娲⒃诒镜氐墓叵凳菘庵小T谔岢鯴语义约束后,当用关系数据库存储牡凳保绾伟颜庑┯镆逶际畔⒂成涞关系数据库中是一个重要的研究课题,具有较高的理论价值和现实意义。本文对上述两个方面的问题进行了相关的研究,具体地说,本文的主要贡献萁诘阒湓谙蛏虾拖蛳侣肪渡系木植肯嗨菩裕虼四芄挥行地处理路径表达式的查询,特别是分支路径表达式的查询。⑸墒奔洹⒙肪恫檠阅艿确矫娼辛讼细的实验,并与饕虯饕髁硕员群头治觥J笛檠芯勘砻鳎,一索引具有较短的生成时间,;凰惴ǎ7⒘擞美窗裍键转换成关系数据库处理路径表达式成为提高檠实墓丶凇和创新之处在于:.提出了一种新型的饕峁梗篣凰饕盟饕浞掷昧较好的查询性能。.研究了两种形式的镆逶际篨键和览担⑻岢义约束转换成关系数据库上相应的语义约束键约束的原型系统。.
甌,,,琇,一琲,瓹,一篨猭琫甅,.,,琩...,甋,,猵.·
琗:琁,.,琣,.
第一章绪论研究背景全球互联网联盟月正式推出来的。某鱿郑谋淞幕久婷玻云涠烙械奶氐阒鸾ネ延倍觯晌猈上数据表示和交换的标准格式。且恢治牡当曜镅裕美疵枋鑫牡档哪谌莺徒的一个优化子集,它将的丰富现有的楹腿砑男餍愿茫佣蚧耸莸拇砗痛洌更适合软件开发和信息分布。与相比,哂行矶嘤诺悖·虻ィ晕颐枋銮乙子诮馕觥J沟肵具有机器可读性,一个应用可以按照各种方式解析、过滤、重构牡怠任意地扩展。那短捉峁箍梢员硎鞠质凳澜缰懈髦指丛拥亩韵螅种格式的数据都可以比较容易地转化为荩馐沟脁非常适于畔⒌姆⒉⒔峁购捅硐秩叩姆掷搿N牡道嘈投ㄒ描述了文档中元素和子元素间的嵌套结构,不同的用户可以通过床煌的显示方式显示全部或部分的文档内容。猿鱿忠岳矗褪艿搅烁鹘绲墓刈ⅲ丫行矶喙救χС諼,比如镜腇,公司的可以用来书写裍作为一种数据库来保存信息。掳通过将文档保存为募梢匀闷笠凳菘獾群蠖嗽怂阆低持新得到以及重新使用文档中的数据。人们也逐渐从信息检索的角度看待傻酱邮菘獾慕嵌热ト鲜端V档锰岢龅氖牵数据库技术在邪缪葑攀种匾5慕巧ǎ嗣怯檬菘饧际趵创娲ⅰ⒉檠分析、加工和集成牡怠8魇菘獬叹合嘣谧约旱牟分兄С諼,可扩展标记语言,乃跣矗构,它的提出是为了弥补在萁换簧系牟蛔恪是功能与的易用性结合到τ弥校蚐龋G崃考叮沟械谋昙鞘枪潭ǖ模荒芾┱梗鳻的标记由用户定义,可以·中的标记表示的是数据的显示格式,没有任何语义,而谋记则明确指出了数据的含义,使得细粒度的荽沓晌?赡堋档,就瞥龅腎仓С窒允綳文档。各大公司推出的其它产品也支持和使用热鏏琖琂扔肵表示各种配置信息,
菟饕在工业界,挠τ酶潜缺冉允牵涸诘缱邮萁换涣煊颍琗丰富的格式语言可以用来描述不同类型的单据,例如信用证、贷款申请表、保险单、索赔单以及各种发票等,而且结构化的牡邓椭罻的数据可以被加密,并且很容易附加上数字签名。在电子交换的基础上,医院、保险公司、电信等各部和τ肵而提出了格式描述语言开放软件描述ü细说明软件的规格、使用说明以及运行平台等信息使得软件可以在网上能时时检查,时时更新版本,而不用用户自己更新或是由软件提供商提供类似服务:在学以描述分子与晶体结构、化合物的光谱结构;在数学领域,数学标记语言可以帮助数学家们将数学公式精确地显示在浏览器上;在生物和医学领域,基因、生物医学数据鹊榷际且訶的应用驱动研究,正是由于应用的需要,关于矫娴难芯坎攀艿窖芯咳员的广泛关注。首先,且恢职虢峁够荩幌蟠呈菽茄墙峁化的,所以研究人员首先是把醋魇前虢峁够堇囱芯俊6菘饨缭半结构化数据的数据模型、查询语言、查询优化、路径约束和模式抽取等方面的研究已取得了一定的进展,因此梢越杓庑┭芯砍晒5牵琗毕专门作进一步深入研究,近几年,关于难芯恳丫晌猄疨、等国际数据库界顶级会议的研究热点之一,几乎每个会议都有大下面将针对本文所涉及的几个研究方面介绍一下研究现状和本文的研究内随着Ⅺ讧晌;チM鲜荼硎竞褪萁换坏谋曜几袷剑⒃诟鞲隽煊虻到广泛的