文档介绍:猼坶:篐:.::.篢:
河北科技大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。除文中已经注明引用
摘要进入世纪,“信息爆炸”时代已经到来。海量信息的产生和存储一方面丰富了网络资源给人们的生活带来了极大的便利;另一方面,信息的过滤、筛选成为了人们合理利用信息的重要方面。搜索引擎就是一种帮助人们在浩瀚的网络资源中寻找所需信息的工具。本文对中文搜索引擎的设计和开发进行了深入研究,并以高等艺术教育网站作为平台实现了支持中文自然语言理解的搜索引擎。为了用户方便的使用搜索引擎寻找互联网上的信息,搜索引擎的使用方法应当更加人性化,并可以为不同领域的非计算机专业人员提供便利。人们越来越希望可以使用人类所掌握、熟悉的自然语言操控计算机程序。带有自然语言理解的搜索引擎自然成为了一个重要的研究方向。本文所研究目的就是使得搜索引擎可以在一定程度上理解人类的自然语言,从自然语言中抽取出关键内容并用于检索,最终达到搜索引擎和自然语言用户之间的良好衔接,可以在两者之间建立起更高效,更深层的信息传递。本文使用作为研究平台,在此基础上开发出带有自然语言理解的高等艺术教育网站的搜索引擎。中文文本的特点是没有空格作为词汇与词汇之间的间隔,因此本文采用了词库匹配的方法对自然语言文本进新了分词。在词典的设计上,我们采用了以首字为键的散列表结构。在进行查询结果的排序时,将用户输入的文本和现有的文本都映射成一个南蛄浚缓笤诹礁鱿蛄恐涠ㄒ辶讼嗨菩缘亩攘方法,并按照该方法对搜索引擎的返回结果进行排序。在实现时,网站的整体架构使用语言平台,但是其中也有一些功能模块以镅员嘈吹腄形式实现。因此还对平台调用姆绞椒椒ń辛搜芯俊最后,我们对该搜索引擎的性能进行了实验性的验证,最终的试验结果表明该设计思路是可行的,实际应用是有效的,它有效地提高了搜索引擎检索出的信息的质量以及显著增强了搜索引擎的交互能力。关键词搜索引擎;自然语言处理;;中文搜索;网站建设;交互
.,.,琣;甒琣甌河北科技大学硕十学位论文瓵,.癱”.;;;.
目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·第绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯课题研究的背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⒄⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯“论文结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯搜索引擎技术研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·全文搜索引擎⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·的内部架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”信息流解析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·文件索引⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·中的数据类型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯索引文件组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯文件搜索模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.级P汀.┱⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·自然语言理解研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·自然语言理解简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于自然语言理解的搜索引擎⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯自然语言理解查询⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯自然语言理解的流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯··智能化查询的交互⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于自然语言处理的搜索引擎模型的实现及其相关技术⋯⋯⋯⋯⋯⋯⋯·.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一
高等艺术教育网站的设计与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·高等艺术教育网站总体设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”.叩纫帐踅逃鞠晗干杓啤的内置搜索模块⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯词汇分析器⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·的中文词汇分析器⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯“河北科技大学硕士学位论文.●■
,“信息爆炸”时代已经到来,飞速发展