文档介绍:国防科学技术大学
硕士学位论文
基于语义元数据的分布式异构数据库集成研究
姓名:张朝阳
申请学位级别:硕士
专业:计算机科学与技术
指导教师:宁洪
20091101
摘要成语义元数据,利用语义元数据解决异构数据库之间的结构异构和语义异构,实随着生物工程领域各种技术的飞速发展,生物数据呈指数级增长。如何对这些分布、异构、自治的生物数据库进行快速有效的整合查询成为生物研究专家面临的一个难点。为了解决目前生物数据集成查询中遇到的问题,作者所在课题组提出了一个基于语义元数据的数据资源整合方案。该方案将要查询的各分布数据库的元数据按照统一的标准集成到一个元数据库中,使用一个领域本体与元仓库建立映射生现对各生物数据库的集成查询。该方案的最终目标是通过对有关内容的研究,解决数据资源整合的共性问题,建立一个通用的数据共享与整合平台,形成面向特定主题的、元数据集中、基础数据分布的虚拟中心数据库,支持在多个领域的应用。目前课题组已经建立了相应的元数据库,开发了元数据导入与管理工具。在此基础上,本文主要对以下内容进行了研究:利用本体知识库与数据库疪模型的相似性,提出把本体与元数据建立映射生成语义元数据,并把语义元数据用于数据集成,用于解决多个数据库间的结构异构和语义异构两个方面的难题。研究了如何利用本体构建知识库的推理功能,通过在生成语义元数据时建立的本体与元数据的映射,对用户的查询进行推理扩展,从而帮助提高系统的查全率和查准率。基于多个数据源的物理分布和逻辑分布性的特点,设计了有效的查询计划生成算法,根据此算法,可以把用户的查询转化为一个对多个数据源的查询计划,并通过执行这个计划,不仅能保证用户查询结果的精确性,而且能保证用户查询结果的完整性。通过以上研究,本文设计并实现了基于语义元数据的分布数据库集成原型系统,用户使用此系统可以基于本体对分布的异构数据库实现透明访问。通过对系统的应用证明达到了研究目的,为课题下一步的研究打下了基础。主题词:数据集成,元数据,本体,语义元数据,语义异构国防科学技术大学研究生院硕士学位论文第‘
..甌;篸,瑃瑆瓸国防科学技术大学研究生院硕士学位论文,,...,.琽瑃疪;甌—.,
表目录表数据源中的部分数据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表数据源中的部分数据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..三种用户权限对应表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据源中的表纠荨数据源中的表示例数据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表数据源中的表纠荨表数据源中的表纠荨表示例查询结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯国防科学技术大学研究生院硕士学位论文第页
图目录图图图菰龀で魇仆肌数据仓库体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯联邦数据库体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯中间件体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于元数据的数据集成体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一个生物本体示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本体类与表之间的互相映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一个本体类与多个数据源的映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一个表与多个类的映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一个本体与同一数据源中的多个表的映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯类的数据类型属性与元数据的映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.对象属性映射情况一⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.对象属性与元数据映射情况二⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.枋錾锸菘獾氖道元数据库中部分表的结构和存储的信息⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一个简单的际纠系统架构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯饕=涌凇饕=涌凇推理机结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯应用示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯的图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.执行一个查询的图⋯⋯一:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯整体结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯糠质堤謇嗉袄嘤肜嘀涞墓叵怠连接本体库的类图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯获取本体树第一级子节点算法的流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表氡鞢狹解析结果数据结构示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯对象属性值域类数据结构示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯纠馕鼋峁本体与元数据的映射示例国防科学技术大学研究生院硕士学位论文第
图图本体与元数据的映射示例查询推理扩展模块结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..查询树示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.推理扩展算法流程图⋯⋯⋯⋯