文档介绍:山东大学
硕士学位论文
数字科技馆中文信息检索系统的设计与实现
姓名:王睿
申请学位级别:硕士
专业:计算机技术
指导教师:杨承磊;周世文
20071015
摘要山东大学硕士学位论文必需,并体现出大众化、终身化和个性化的特点。这就要求教育提供大覆盖面、多方式、全方位的服务,保证任何人、任何时间、在任何地方可以接受所需的教育,获取所需的知识。随着网络技术的发展,网络教育为上述需求提供了一种很科技馆作为青少年的教育基地,担负着普及科学知识,为青少年提供教育的重任。但是由于地理位置、资金、场馆条件等各种客观原因,其科普的作用受到了一定的限制。因此,立足现有科技馆的资源,利用网络技术,建立数字科技馆,开发网上展品和其它多媒体内容,建设一个面向全社会的网上科技馆,提供数字科技馆作为一个重要的网络科普平台,提供对信息的检索功能必不可少。目前,一般的数字科技馆系统大多是较大型的网站,只提供简单查询、组合查询以及模糊查询等操作,很少提供对已有的其他网站的相关知识的统一检索。主要是采用搜索引擎、自然语言查询、摘要生成等技术,重点研究开发一个面向数字科技馆的中文信息检索子系统。通过该系统,人们可以通过使用自然语言,方便准确地获取数字科技馆中的科普信息,同时在杂乱无章的网络世界中快速、设计实现了面向数字科技馆的受限自然语言理解与数据库查询子模块,在人类进入世纪的今天,科学技术日新月异,知识经济初见端倪,社会对劳动者提出了更高的要求。素质教育和终身教育成为在未来社会中生存的一种好的解决方案,正在成为学校和公众教育的重要模式。方便快捷的网络教育服务,势在必行。用户需要将自己需求表达成一个个关键字,计算机系统再根据这些关键字才能比较容易的在数据库中进行查找操作。为此,本文结合山东省科技馆正在研发的“山东省数字科技馆”系统的需求,准确地获得自己需要的信息。概括地说,针对数字科技馆的需求与特点,本文主要做了如下工作:研究设计了面向数字科技馆的中文信息检索子系统的系统架构。
山东大学硕士学位论文利用搜索引擎、摘要自动生成技术,设计实现了互连网信息查询子模块,可在网络上快速准确地查找相关的信息,并给出信息的摘要。关键词:信息检索;自然语言查询;搜索引擎;自动摘要给出了符合数字科技馆需求的受限汉语的文法和规则,定义了相关的数据词典。本系统检索的信息目前仅包含恐龙的相关知识,以后希望可以扩展到多个方面。当然,系统本身仍存在不完善的地方,如受限自然语言的歧义性,搜索结果的准确性等,这都将是下一步工作的方向。Ⅱ
山东大学硕士学位论文禷∞曲皿删姗’莚咖岫,删猰眦岫,,瑃一—.猰籨,琯瓵,,琣,棚订,痵—Ⅱ,甤,,Ⅱ
山东大学硕士学位论文叭岫哪Ⅷ鰏尽岫叫鷌珊肌瑚锄轪№.蛐,,岣,,骯,.,。:.锄—,。,,瑃’甋,
:緀,伽山东大学硕士学位论文謌誸,∞靐
⋯一:监翩签螂日期:一⒖原创性声明和关于论文使用授权的说明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不关于学位论文使用授权的声明文的全部或部分内容编入有关数据库进行检索,可以采用影印、C苈畚脑诮饷芎笥ψ袷卮斯娑原创性声明包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:期:本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论缩印或其他复制手段保存论文和汇编本学位论文。日
第虑把山东大学硕士学位论文研究背景现今科学技术日新月异,知识经济初见端倪,社会对劳动者提出了更高要求。素质教育和终身教育成为在未来社会中生存的一种必需,并体现出大众化、终身化和个性化的特点。这就要求教育提供大覆盖面、多方式、全方位的服务,保证任何人、任何时间、在任何地方接受所需的教育,获取所需的知识。随着网络技众教育的重要模式。我国现在接入互联网的计算机数量和使用计算机上网的人数越来越多,人们上网的方式和内容也向多元化发展,使得网上数字科技馆的建设科技馆作为青少年教育基地,应该担负起青少年教育的责任。但是因为经济、地理位置等客观因索的制约,现有的科技馆一般建设在经济发达、地理条件优越的中心城市,客观上使得二级城市以及广大农村的青少年很少有机会参观科技馆,这使得科技馆的教育作用大大降低。如何立足现有科技馆的资源,开发网上展品和其它多媒体内容,建设一个面向全社会的网上科技馆,使用户就好像来到真实的科技馆一样,浏览、体会、触动展品,同时还可以了解各种科普知识,是科技馆发展的需要,因此我馆建立了数