文档介绍:西安电子科技大学
硕士学位论文
一个Native XML数据库——dbXML的存储策略研究与改进
姓名:王光平
申请学位级别:硕士
专业:计算机软件与理论
指导教师:徐学洲
20050101
摘要菘馐堑鼻笆菘饬煊虻难芯咳鹊阒弧文档在菘庵械拇娲⒑退饕呗裕鞘滓9匦牡奈侍狻J紫龋疚奶教至薠与数据库的相互关系,研究了牡翟贜数据库中三种不同的存储策略,给出了菘獾恼褰峁梗⑸钊胙芯苛似涫莨芾怼⑺饕查询、事务、并发性和安全性等多方面内容;其次,本文以一个开放源代码的菘獠贰!猟为对象,深入分析了它的分层存储模型,研究了它的页面存储策略、树索引结构、压缩饕约拔牡当泶娲⒛P等;最后,本文针对其页面存储策略在“空闲”页面管理上存在的不足,提出并实现了尾部页面截取策略和页面移动策略,有效地释放了“空闲”页面占用的磁盘空间,提高了系统对磁盘资源的利用率。菘存储策略关键词:压缩树
鵐:瓵..,.瓼.,,。竣鯨.,,,.
垒坌:三釜盟至盏主日期海:』蔓关于论文使用授权的说明创新性声明本学位论文属于保密,在——年解密后适用本授权书。本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。C艿穆畚在解密后遵守此规定导师签名:
第一章绪论输。此外,Ⅺ乩还可以处理各种数据,包括文本、图像和声音,并且可以由用户菘獾难芯肯肿春陀τ昧煊引言可扩展标记语言狤那么,究竟怎样来管理为数众多的昙堑氖一种很有希望的方法是用数据库对妇幔写娲ⅰ⒓焖骱筒僮鳎窗裍标记的数据收入一个框架系统——咖数据库耍盼4娲⒑凸歉髦质萏乇鹗文档的首选格式。由于它具有标记不同字段的能力,使得搜索变得更简单和动态化,从而把企业包含大量数据信息的文件变成了进行数据挖掘的宝藏。涯容从演示格式中解放出来,使材料可以多次重复使用。这样以来,同样的内容可以分别用于新闻发布、自皮书、宣传册、演示和趁妗6阅切┬枰0巡患嫒的系统融合在一起的企业,梢猿涞惫ü泊涔ぞ撸灾行愿袷浇惺荽进行扩展以处理任何特殊类型的数据。恼庑┨匦允怪晌T谙吆屠胂呤的共同语言。中,在一种更容易管理、更系统化、更为人们所熟悉的环境中完成搜索、分析、更新和成果输出工作。目前,传统的数据库厂商纷纷在自己的产品里加入了对闹С郑怪梢源娲⒑投寥数据;另一方面,一种新的数据库管理理牡瞪杓疲嬗幸话闶菘獾奶匦裕缰С质挛瘛⒉⒎⒖刂啤⒉檠言、安全机制、二次开发接口等,但就目前来说,菘庠谛阅堋⒉发性、安全性等诸多方面,还不能同传统数据库相比【羽。菘馐且种新型的数据库技术,是当前的研究热点之一,随着墓惴涸擞茫琋菘庖步鸾コ墒炱鹄础菘庾缘岳矗鸵鹆搜踅绾凸ひ到绲募ù笮巳ぁ4幽前菘獾牟非榭隼纯矗踅绲氖笛橄低澈褪谐〔分溆凶一些微妙的差别,尽管它们的主流技术是一致的。学术界完成的实验室原型系统一般侧重于下面的一些特点:·专注于查询性能的提高,对查询优化的研究较多NA颂岣卟檠剩
菘狻?痓拇娲⒀芯亢透慕是有着一些差别,导致学术界十分重视索引结构的设计,先后提出二十几种适合于莸出了以结构化联接为基础的查询模式匹配方法。·强调平台无关性。在菘庋芯康脑缙冢到缭嬖谝桓稣论:到底将荽娲⒃诠叵凳菘庵校故橇硗饪7⒋娲的物理数据库。这在一定程度上影响着难芯空撸谏杓扑饕峁故北须考虑使索引过的菘梢源娲⒃诙嘀质菘饨峁怪小从理论角度较多地考虑了菘獾哪J缴杓乒娣痘侍鈏。设计了基于键的函数依赖推理,在如何优化菘馍杓啤⑾冗余和不一致方面有了一些实质上的进展。菘獠犯忧康魇涤茫凶乓恍┯胙踅缭拖统不尽相同的特点:●在底层提供了“集合”的数据结构,以存储K亟诘悖ü鼴结构来索引这些元素节点。“集合”之上一般还会有一级或两级索引,以加快查询处理速度。这一点比平台无关的实验原型系统更高效实用。·引入了日志管理,建立了较完善的事务处理机制。目前的商用菘庖话闾峁┦挛翊砉δ埽ㄌ峤弧⒒毓龊腿罩疚募Mü提供事务日志机制,记录系统执行的每个事务的详细情况,保证在系统出现问题后可以完全恢复。●异构数据源的集成管理。借助际醯目衫┱剐裕谐∩系腘菘獠酚涤屑梢旃故菰吹