文档介绍:摘要畔⒌姆植夹浴⒍蕴氐闶勾撤椒岩月鉝环境下的信息集成要求。是共享概念模型的明确的形式化规范说明,它在语义层上提供了畔⒓傻男路椒āD壳埃庠谡庖涣煊虻难芯抗ぷ髦氐闶荗语言’规范的制定及应用,而国内则处于跟踪研究阶段。本文旨在研究在信息集成中的具体应用方法。并用它来解决畔⒓芍兴媪俚挠镆逡构问题。本文的研究成果体现在以下两个方面:芙崃薕镅韵喙毓娣短氐愫陀τ梅椒本文在对/等语言相关规范进行细致研究之后,总结了它们的特点和应用方法,并设计了多个实例对其进行具体论述。搜索引擎的不足,能够为用户提供智能化的查询服务。杓屏艘桓鯳智能查询系统该系统以美国马里兰大学项目的实验性檠低澄2慰冀猩计,并做了一些改进:用表示能力更强的语言替代语言,并对数据存储方式也提出了新的解决办法。该系统可以解决传统的基于关键词匹配最后,本文总结了用实现畔⒓傻谋局剩矗涸谟镆宀憬立共享的信息模型,并用语苦对数据源给予形式化表示。关键词:琌镆澹问交畔⒓北京邮电火学坝士研究生论文基于的畔⒓裳芯
,琩琑琫.,甇北京邮电人学颂:篛可畚基于的畔⒓裳芯甀瓵琭’琣甌—瑂.,.甇,’
攀际醴⒄辜蚪●募虺疲形拿莆!傲Γ薄6杂赪,有人认等同于。在本文中,仅仅把醋魇腔谔囟ū硐指袷、等置标语言统性匦囊恢钟τ茫隖、、甿虶科学家们能在服务器上创建新的文档。为了支持此计划,唇艘恢中碌挠言来传输和呈现超文本文档。这种语言就是超文本置标语言囊桓鲎蛹K且桓鲇τ貌愕男椋枰5撞愕拇湫槲其提供可靠传输保证。被用于标识蛘哂隝相连的主机上的任何可用的数据对象。在上的任何一台机器上访问任何可用的公共数据。这些一定的信息由以下的》数据所在的机器肭笫莸氖菰炊丝为它是包括了全球所有计算机、网络以及其中信息的一个环球信息网,甚至把它一样都是基于更底层的通信协议支持的应用。只是相对于其他应用,它具有更加友好的用户界面,从而能被众多用户接受并熟悉。,目的是使科学家们能很容易地翻阅同行们的文章。此项计划的后期目标是使K潜曜纪ㄓ弥帽暧镅許用于操作和其他牡档男楸怀莆3谋敬湫镠使用了统一资源定位符这一概念。它概念背后有一个基本思想,那就是:在提供一定信息的条件下,用户能在基本部分组成:》所使用的访问协议≯通向数据的路径荳螭于的芟⒓裳芯北京:人学粄,貉芯可畚第.
畔⒌奶氐·海量数据·浏览器——这很大程度上是微软公司把它与占据市场绝大部分市场的僮怂枋莸奈募借助于梢栽谙嗷ス亓5男畔⒅浣⒘唇樱⑹拐庵至唇铀克肯嗫地扩展丌去,建立一个包含无穷信息的知识网络。在用户一侧,访问试吹目突Ф顺绦蚴且桓隹梢越馐虷镅缘匿览器。它识别出所访问文档的不同标识,并根据语言规范把其中的文本、图像、视频、音频信息展现出来,提供一个简单易用且有强大表现能力的用户接口。最初的浏览器有拦页都扑慊行的,网系统捆绑销售的结果。从年丌始,丌始在贤度胧褂茫⒀杆俚玫饺嗣堑那醉人们提供了更多有价值的资源,把更多的用户吸引到侠矗ù蟮准确地判断出当前鲜萘康拇笮。还颐侨匀豢梢酝ü愕蜗咚鞣⑾一些端倪。网上的知名搜索引擎可以提供非常有价值的参考数据:在所能收集到的这些页面数目,但是鉴于被公认的强大搜索能力,我们有理由相信目前趁娴淖苁谑诘牧考渡稀R4诱夂迫缪毯5氖葜醒速获取有价值的信息将是一项非常有挑战性的工作。谋曜几袷轿#景公司的等;如今办公和家庭用户使用最多的是微软的成为系耐跖朴τ。表现力丰富的界面和易用性使人们乐于使用浏览器上网,巨大的需求使得镜闳缬旰蟠核癜愕赜肯郑推动了姆⒄梗蛊涑氏殖鲆恢种甘椒⒄沟奶啤H缃瘢贗上已经有数以百万计的镜愫褪诘腤页面,使它成为世界上覆盖面最广、规模最大、内容最丰富的信息库。癢的开放性使人们可以不受限制地在上面发布信息,这样上的数据量迅速增加,并拥有几乎无限的增长潜力。这种高速增长使得谁也无法海痺..的首页上,::数字是年。显然,目的系囊趁孀苁嘤贕:/,://北京邮看笱渡涎芯可畚基于的畔⒓裳芯第,
畔⒓●分布性●动态变化异熬咛灞硐衷冢受到任何组织的限制。然而,由于缺少集中控制,也使得有效获取畔⒉进行相应的推理变得非常困难。首先,不同领域的作者会使用不同的词汇集,从而导致同义词从貌煌拇视锢疵枋鐾桓龈拍和一词多义赐桓龃试页面的可信度就不能得到保证。再次,来自不同信息源的信息之间可能会存在着冲突,其中一些冲突可能是来自世界观的异议,不同的团体、组织、国家会在基本的问题上有着难以调和的分歧。改正拼写错误或是调整段落顺序并不会改变原有文档的意思,而另外一些改动则可能完全改变原有内容的意思甚至是删除大量的信息。在肪诚陆行畔不同团体对同一领域事物的认识和表示往往不同,使得来自不同数据源关体,’随着时间变化,由于知识水