文档介绍:西安电子科技大学
硕士学位论文
基于本体和服务发现的Web信息集成研究
姓名:吴楠楠
申请学位级别:硕士
专业:计算机软件与理论
指导教师:徐学洲
20070101
摘要随着畔⒌谋ㄊ皆龀ぃ绾喂菇╓信息集成系统来有效地组织和管理题。本文在深入分析和讨论畔⒓上低车难芯肯肿春头⒄骨魇苹≈希出了一个基于本体和服务发现的畔⒓上低常⑽葡低持械募父鲋饕9丶技术,如:在领域本体构建和数据源的服务封装和服务描述以及基于服务发现的改进了传统的虚拟集成方法,在和数据源之间增加了一个务库层,包含了用窦际醴庾暗母魇菰窗捌鞯姆瘢⒉捎糜镆錡服务本体描述语言愿魇菰捶窠杏镆迕枋觯纬闪酥薪槠骱褪菰义匹配与选择算法,它采用语义相似度的计算,实现服务选择,完成查询分解。此外,系统使用基于领域本体构建全局和局部视图的策略,避免领域中概念的语设计和实现了集成系统的领域本体、基于领域本体的数据源服务包装与语义描述和模块,包括查询处理、服务发现与选择策略等模块。并介绍了主关键词:畔⒓杀咎穹穹⑾钟镆迤ヅ分布于世界各地海量的荩又杏行У幕袢∮杏眯畔ⅲ晌H嗣亲罟刈⒌奈查询分解技术等方面进行了研究,其主要内容如下:的松散耦合结构,使得数据源访问更具透明性。在实现上,系统采用了带语义的动态服务发现机制实现J剑满足了畔⒓上低扯允菰吹亩┱剐枨螅辉诓檠纸夥矫嫣岢隽艘恢钟义冲突。要的本体结构和查询分解策略的实现情况。
,,甌..瓼,琣,籇:琣琲:甌甴,,:甀,—琲琣,.
日期驾伴本人签名:黑蕴缝日期崮轴犁疽日期幽社犁且本学位论文属于保密在一年解密后适用本授权书。关于论文使用授权的说明创新性声明离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。·申请学位论文与资料若有不实之处,本人承担一切相关责任。本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。C艿穆畚脑解密后遵守此规定本人签名:导师签名:’
第一章绪论研究背景研究内容如今网络已成为人们进行信息传递和共享的一种重要工具,上海量的畔⒆试闯晌A巳蜃畲蟮闹J恫挚猓缂际踝魑R恢中碌幕肪匙试次P录术开辟了新的领域——畔⒓伞信息集成的目标是将不相容的、不同模式的分布式畔⒃吹氖萁杏行У募伞S没Э赏ü骋坏姆梦誓J酵该鞯对分布式信息源进行访问以完成对信息搜索,而无需了解具体的分布式信息源的数据源有数据模式相对稳定,数据源的数量变化不大的特点。如今,随着信息源分布的越来越广泛,系母髡镜阈畔⒁丫晌R恢种匾5男畔⒃矗欢菰捶植抗惴海涫砍杀ㄊ皆龀ぃ黄浯危菰吹慕ⅰ⒃诵杏胛は我们针对畔⒓伤婕暗母鞲龇矫妫绕涫瞧浼傻亩韵蟆!獁信息本体的畔⒓上低车慕峁埂劲数据源的穹庾埃约盎谟镆宓姆衩枋龇椒ā信息结构和访问接口。如何构建集成的畔⑾低忱从行У刈橹凸芾矸植加谑界各地的海量数据,提高信息获得速度并合理、高效地利用这一巨大的信息资源已经成为信息集成研究领域的一个热点问题。传统的信息集成数据源多集中在异构数据库、异构多文档等方面的集成,其当前畔⒗丛炊嘀侄嘌欣醋訦场⒌缱佑始⒌缱颖砀瘛⑽谋疚募及语音邮件等等,与传统数据源相比这些菰淳哂凶约憾捞氐奶氐悖菏紫龋互独立;再次,菰粗械氖菔粲诜墙峁够虬虢峁够荩扛鍪菰炊有自己的数据模式,各个数据源之间缺乏一个统一的语义集;最后,莞和变化都非常频繁。正是由于菰此哂幸陨霞父鎏氐悖夷谌莺捅硐址绞揭苍诙化,结果使褥荽τ谠勇椅扌虻淖刺菁尚院懿睿数据集成系统带来了很多挑战性的问题。现阶段,畔⒓梢鹆酥诙嘌芯空叩男巳ぃ进行了大量的工作并取得了一定的成果,但是该领域仍然处于初级阶段,有很多关键的地方存在很多的困难。源服务的语义描述以及集成中的查询分解技术进行了有效的研究。构建了一个基于本体的畔⒓煽蚣埽渲饕5难芯抗ぷ饔幸韵录傅悖咎在畔⒓芍械挠τ茫煊虮咎宓慕ⅲ约盎诹煊
论文结构第四章主要介绍此畔⒓上低持幸桓鲋饕5奈侍狻!A煊虮咎宓墓菇第五章介绍此畔⒓上低持辛硪桓鲋饕5奈侍狻!2檠纸馕侍狻V饕内容有:本系统采用的查询分解方法的介绍,即带语义的服务发现技术,基于领域本体的畔⒃疵枋龇椒ǖ南晗杆得鳎约叭绾问褂昧煊虮咎宓挠镆逑嗨贫绕配实现服务发现和选择等内容。第六章实现该畔⒓杉际醯脑拖低常⑼ü道运捎玫姆