文档介绍:安徽农业大学
硕士学位论文
XML数据在关系数据库中的存储技术研究
姓名:马竹娟
申请学位级别:硕士
专业:计算机应用技术
指导教师:汪宏喜
2011-06
摘要
随着 XML 数据的可扩展性和自我描述性的日益发展,越来越多的开发者
将其视为网络数据传输的主要形式。XML 文件本质上是保存信息的结构化载体,
它对自身数据库的处理能力是有限的。将 XML 数据转换成关系数据,然后凭借
关系数据库的强大功能来处理 XML 数据,将带来可观的处理效果。
然而,响应时间是评价数据处理的一个重要指标,因此如何提高响应时间
已成为各个研究者的目标。由于底层存储表达对上层的查询和优化有着重要的影
响,因而也是提高处理 XML 数据响应时间的有效方法。
本文以边模型映射为基础,提出了一种优化的基于关系数据库的 XML 文档
存储方案。具体来讲:
(1)与边模型映射中的独立值表映射方案不同,本文按照文档中的节点类
型对 XML 的文档树进行细化,进而提高了 XML 文档重构的准确性;
(2)本文采用节点序号和路径相结合的方式记录每一个元素节点的路径信
息,进而有效地提高了文档的查询性能。
(3)最后,基于该存储方案,设计实现了针对该方案数据库的操作原型。
本方案有效地解决了 XML 数据库的底层存储表达,进而提高了响应时间,
与此同时提高了对存取结果进行重构的准确性。本文实验通过对纯 XML 文档和
XRel 模型进行比较,实验表明本方案无论在性能还是在存储空间上都有较大幅
度的提升。
关键字:存储方案,边模型,文档树,联合表,数据库模型
I
ABSTRACT
As powerful extensibility and self-description ability of XML, more and more
developers have employed it as the main mechanism for transforming data on
networks. As a matter of fact, XML file is inherently a structure for storing
information, and it incapable of processing all the date it holds. By transforming the
XML data to relational data, and using the powerful data manipulation ability of
relational database, we can get a considerable processing result.
As an important target, many researchers have laid their attention on reducing the
response time of data processing. Base on edge-mapping, this paper proposes an XML
data storage mechanism. The mechanism can effectively transform the XML data to
more power relational data, specifically:
(1) Different from the mechanism of separate-value-table, this paper
specifies and clarifies the document tree according to the node type of
the XML document. By doing this, we can improve the reliability of
XML document reconstruction.
(2) By employing the strategy bining the order number and the path
of each node, we can specify the path information of each node. This
further improves the performance for querying XML document.
(3) At last, based on t