文档介绍:安贰邸疨’’畂,骸疕
一
盔:邃型里:五:独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:关于论文使用授权的说明本人完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文不属于保密范围,适用本授权书。日期:导师签名:
■一
面向校园网的搜索引擎的设计与实现摘要目前,在国家大力发展职业教育的形式下.,高等职业教育发展迅的信息显得越发困难。为此,面向校园网的搜索引擎系统应运而生。校园网导航工具。考虑到校园网中所有网页都是基于学校域名下链接的搜集工作时,正是利用校园网中信息资源链接地址所具备的这一特有特征,完成对网络爬虫运行环境的调试、爬行种子的定义和类型的猛,办学规模不断扩大。随着各高等职业院校管理制度的健全和改革力度的深化,在考虑不断提高教学管理水平、质量和效率的同时,依靠数字化校园建设的重要性和必要性显得尤为重要,它是高等职业教育信息化管理发展的必由之路。因此各高校加快了信息化建设的步伐,校园网内容在不断充实和丰富的同时,也在很大程度上提高了学校的工作效率和办学质量。但是,伴随校园网软硬件设备的投入和建设,以共享学校信息资源为目的的校园网呈现出爆炸性的增长态势,而每个用户真正感兴趣的信息非常有限,仅仅是其中的沧海一粟。无论是校园网内或是网外的用户在浩瀚的校园网网海中找寻到有价值在校园网信息高速膨胀的今天,搜索引擎已经成为了非常重要的地址的扩展地址,搜索引擎在通过网络爬虫来完成校园网中信息资源配置。针对校园网资源的更新速度制定出网络爬虫合理的爬取周期,不断发现和搜集校园网内新的网站和网页,利用开源库,●
所提供的瓿啥酝缗莱嫠鸭男T巴程囟ㄎ本信息的提取工作。在此基础上,、提取、组织和处理,形成索引文件最终为用户提供检索服务以达到信息导航的目面向校园网搜索引擎的出现,弥补了用户在使用通用搜索引擎检索过程中,所得结果覆盖面广,存在着重复以及垃圾信息的特点,为结合当前对校园网情况的分析,本文主要完成了如下工作:谏钊肓私馑阉饕嬖诵性淼幕∩希范吮鞠低尘咛怨愣掣咝PT巴氖导市枨笪3龇⒌悖瓿闪诵枨蠓治谰萆杓频哪勘旰驮蛏杓瞥鱿低车淖芴褰峁梗魅妨讼低/匿过定制和扩展霞缗莱媸迪衷谛T巴诘淖试磁廊杓撇⑹褂酶髦諥叨酝缗莱媸占乩吹男畔⒔谐谏钊胙芯縇捌湎喙丶际醯幕∩希右孕薷暮屠┱梗使之应用于本系统中,最终实现了面向校园网的索引和检索的。由于该搜索引擎系统是针对学校校园网具体需求而开发的,因此能更好的满足用户面向校园网信息搜索的需要。用户提供了更为精准的个性化服务。实现需要用到的各个开源组件及其相关技术。说明文档。的业务流程。工作。取和处理。’
瓿闪讼低车娜肟谝趁嫔杓坪褪道牟馐怨ぷ鳌关键词:搜索引擎;检索服务;网络爬虫;服务。
■
,瑃甀琣,.
瑃甌,,,.甇瑆’琒。。