文档介绍:摘要数据,穷信息”、“信息迷航”、“信息过载”等问题和现象。作为因特网信息检索工具——随着的快速发展,特别是际醯姆伤俳剑缫殉晌H蜃畲蟮姆布式的信息知识库。一方面这为信息资源的共建共享提供了一个良好的平台,但另一方面又大幅度地提升了信息检索和知识获取的成本,使得信息查询和索取越来越难,出现了“富关键技术进行了研究和探讨,重点从理论上研究了开发用于满足科研人员及专业科研图书馆的工作需求的基于专题信息服务的智能搜索引擎系统所面临的问题和解决方案。本文首先分析了当前网络资源的现状和特点、搜索引擎的不足、信息服务工作所面临发展方向。接下来重点探讨了目前开发智能搜索引擎所涉及的热门技术的研究与进展情况。主要包括畔⑺阉骷际酰琖信息提取技术,畔⒓焖骷际酰琖聚类技术和搜索引擎的评价技术等。并结合实际工作和未来搜索引擎的发展趋势,给出了一个基于专题信息服务的智能搜索引擎的框架结构。围绕智能化系统,增加了专题知识库、用户知识库和信息推荐模块来加强搜索引擎的个性化、主动性服务的功能。本文还根据专题搜索引擎的特点,叙述了专题搜索引擎应采取的更新策略,并提出了一个适合于专题搜索引擎的畔⑺阉鞑呗裕康氖俏1Vね缁魅嗽谙钟杏布璞义结构的和基于模板的文本文档的语义结构的承畔⑻崛〕绦颉关键词:搜索引擎、畔⒓焖鳌⒆ㄌ庑畔⒎瘛⑿畔⑻崛数据挖掘搜索引擎经过多年的发展与改进,为科研人员,特别是为专业信息服务人员从网上检索和获取信息提供了极大的方便,但无疑也面临着巨大的挑战,本文就智能搜索引擎所涉及的的突破,指出了具有个性化、主动性服务的专题智能型搜索引擎是开发新一代搜索引擎的条件下能较高效率地完成对承畔⒌南略赜敫氯挝瘛M苯岷鲜导使ぷ鳎氐阊究了基于语义结构的承畔⑻崛〖际酰晗附樯芰宋颐强7⒌牧街只诟袷交挠第国防科学技术大学研究生院学位论文
,瓵、、,百,国防科学技术大学研究生院学位论文甅..,.琣保癵,.:第页甌琤“,保“.,畐琩琣.,—瑃甌瑆瓹,瑃.,,
媾讨恋主:圣学位论文题目:基至墨丝龌&咽ヘ降晾菪苄日期:—枷争年土月功日独创性声明%学位论文版权使用授权书日期:皖们唧年,月勿日其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C苎宦畚脑诮饷芎笫视帽臼谌ㄊ椤作者指导教师签名
图目录图空行判定流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图智能搜索引擎知识加工流程图⋯⋯⋯⋯⋯⋯⋯向量空间模型及文档间的相似度⋯⋯⋯⋯⋯⋯图文档向量与查询向量示意图⋯⋯⋯⋯⋯⋯⋯⋯绲幕窘峁埂图查全率与查准率关系图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图搜索引擎的系统结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图个性化主动信息服务工作的流程图⋯⋯⋯⋯⋯图用户反馈查询图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯网页集合砅,和庙的情况⋯⋯⋯⋯⋯网页⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图把网页载入装配器图加入数据库表奶崛〗峁图装配器惴鞒獭图无用信息的关键字模板库界面⋯⋯⋯⋯⋯⋯⋯图期刊目次自动排版系统操作界面⋯⋯⋯⋯⋯⋯图图基于专题信息服务的智能搜索引擎的系统结构.。图甶国防科学技术大学研究生院学位论文第溢页..⋯.
表目录因特网上各种信息流量比例⋯⋯⋯..检索变化表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯搜索引擎的覆盖率与无效链接率统计网页与专题相关情况表⋯⋯⋯⋯⋯.误检与漏检网页情况表⋯⋯⋯⋯⋯.期刊目次下载网上资源分布表⋯⋯..表第页国防科学技术人学研究生院学位论文.
第一章概述里堕型鲎垫查查兰竺茎生堕兰垡兰苎§研究背景【⒆试聪肿因特网殖苹チM怯墒澜绮煌婺!⒉煌嘈偷募扑慊舜送ü锢设备、物理技术以及软件协议相互连接而形成的覆盖全世界的超级计算机网络。因特网的因特网起源于美国,它的前身是美国国防部高级研究计划署防部通讯局成功地研制用于异构网络的疘椋⑼度胧褂谩甏衅冢拦家科学基金会将疘槔┱梗胗泄氐墓沂笛槭液痛笱У募扑慊嗔ǔ扇研究与教育骨干网,正式取代了晌R蛱赝闹鞲赏4撕螅澜缟因特网元年【。随着因特网规模的空前扩大,因特网上发布和传播的各种信息资源的数量也呈现为几种:远程登录、文件传输⒌缱佑始﨓.、电子公告牌服务蛍服务。其各占因特网信息流量的情况可见表弘】:从表中可看到裾剂艘蛱赝畔⒘髁康木蠖嗍蚨鴚服务