1 / 32
文档名称:

InfoMall数据检索服务的设计以及全文检索系统的初步实现.doc

格式:doc   页数:32页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

InfoMall数据检索服务的设计以及全文检索系统的初步实现.doc

上传人:策划大师 2011/11/13 文件大小:0 KB

下载得到文件列表

InfoMall数据检索服务的设计以及全文检索系统的初步实现.doc

文档介绍

文档介绍:InfoMall数据检索服务的设计以及全文检索系统的初步实现
InfoMall Data Retrieval Service and its Full Text Retrieval System
姓名:
学号:
院系:信息科学技术学院
专业:计算机科学与技术
指导教师:
2005年6月
论文评定
导师评语
为历史存档的网页信息提供全文信息检索,是更好展示和挖掘网页历史信息必不可少的手段。为历史存档网页建立索引提供检索服务,不同于搜索引擎,通常其数据量更大,并且具有自己的特性。杨志丰同学的毕业论文工作,是对这一部分内容有益的探索。
论文所涉及的工作是在中国Web信息博物馆(InfoMall)的基础上完成的。通过对InfoMall网页信息博物馆的数据需求的分析,利用基于时间、空间、内容的网页数据三维模型,设计了InfoMall数据检索服务,并规约了服务原语,设计了系统组成。该文进一步设计和实现了InfoMall数据检索服务的系统组成中的主要模块——全文索引系统。主要针对InfoMall数据的特点和数据检索服务的需求,在空间利用率和系统灵活性两个方面做了探讨和优化。
论文内容丰富,所涉及的工作量大,且有较强的系统性,是一篇很有价值的论文。
在毕业设计工作的过程中,该同学态度端正,积极努力,表现出很强的进取精神和踏实的工作作风,为InfoMall的发展做出了贡献。
成绩___优______ 指导教师签字__闫宏飞_______
_2005_年_6_月_9_日
摘要
中国Web信息博物馆是北京大学网络实验室研究和开发的中国万维网(World Wide Web)历史信息的存储和展示系统。但现有系统提供的服务不能满足用户对宝贵的历史网页数据的信息需求,因而限制了它的广泛使用。本文试图从实际出发,探讨和尝试如何利用保存下来历史网页数据提供公共信息服务。
本文通过对InfoMall网页信息博物馆的数据需求的分析,利用基于时间、空间、内容的网页数据三维模型,设计了InfoMall数据检索服务,并规约了服务原语,设计了系统组成。例如,利用我们提供的服务,用户可以查询“1997年2月到2005年2月期间内蒙古自治区范围内所有*.域名下内容包含‘民主’的网页文档的全文”。
本文设计和实现了InfoMall数据检索服务的系统组成中的主要模块――全文索引系统。我们主要针对InfoMall数据的特点和数据检索服务的需求,在空间利用率和系统灵活性两个方面做了探讨和优化。
关键词
InfoMall,历史网页,信息检索,倒排文件,索引
Abstract
Web InfoMall is a digital library to store web pages of Chinese World Wide Web periodically and exhibit them to people online, which is designed and developed work and Distributed Systems Laboratory of Peking University. However current available services are too limited to meet user’s information needs and prevent it from being widely used. That is a great waste of the valuable archaic web pages. In this article, we present our ideas of how to use these archaic web pages to provide information service to public.
In this article, we analyzed the user’s information needs and designed a powerful service called InfoMall Data Retrieval Service, using a three-dimensional model based on time, space and content. We specified the syntax of query and designed ponent of the system. In addition, we designed and implement the full text retrieval system that is a ponent of InfoMall Data Retrieva

最近更新

深静脉血栓的预防护理ppt课件 29页

中山市人民政府办公室印发中山市交通工程造价.. 15页

南宁市人民政府办公厅关于调整市森林防火指挥.. 5页

国家民族事务委员会关于深入学习贯彻中央民族.. 8页

微德育(共5篇) 13页

最高人民检察院公诉厅关于印发《人民检察院办.. 18页

湖南九年级英语期末考试(2022年下半期)附答案.. 23页

精神病学名词解释解 8页

超超临界锅炉屏过超温分析及预防措施 7页

阳江市人民政府办公室关于开展阳江市数字政府.. 22页

口腔护理老年护理ppt 27页

精神病患者拒食的护理ppt课件 21页

面向未来人才引进计划的长期发展战略 28页

外泌体在脊髓转移癌中的生物标志物潜力 33页

协商协议博弈中的公平性与效率 34页

护理心理学第七章第四节ppt 21页

护理实习策划书ppt内容 27页

护理临床输血护理ppt 23页

结缔组织病相关间质性肺病的新生物标志物和诊.. 27页

电子商务行业市场调研及竞争态势分析培训课件.. 27页

春的作文500字十篇 10页

演出节目活动策划方案 27页

氧化铝项目风险管理分析报告 31页

春节习俗文化元素的融合 25页

新时代医疗人才培养:技能与道德并重培训课件.. 26页

提升酒店员工服务质量的培训方案 31页

2024年营销计划范文汇编九篇 36页

厂房空调冷量设计标准 5页

北京故宫故事50字 2页

皮试配制方法 2页