1 / 70
文档名称:

Deep Web动态搜索的研究--基于图书网站的动态搜索.pdf

格式:pdf   页数:70
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

Deep Web动态搜索的研究--基于图书网站的动态搜索.pdf

上传人:minzo 2014/3/29 文件大小:0 KB

下载得到文件列表

Deep Web动态搜索的研究--基于图书网站的动态搜索.pdf

文档介绍

文档介绍:作者签名:生遣遣∑作者签名:.垄塑日期:兰堇即灾鞯保密论文注释:本学位论文属于保密范围,在上年解密后适用本授兰了啃纽北京化工大学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。关于论文使用授权的说明学位论文作者完全了解北京化工大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京化工大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。日期:学位论文。导师签名:
中图分类号学科分类号论文编号密公开学位授予单位代码学位授予单位名称北京化工大学作者姓名李海滨学获学位专业名称计算机应用技术获学位专业代码课题来源自选项目研究方向论文题目印阉鞯难芯恳灰换谕际橥镜亩阉关键词表单解析,动态填充,结果页面解析,结果项排序论文答辩日期论文类型应用研究学位论文评阅及答辩委员会情况姓名职称工作单位学科专长指导教师许南山副教授网络数据库山岚教授搜索、可重构计算评阅人答辩委员会主席赵瑞莲软件测试、软件可靠性答辩委员信号检测,信号处理何苏勤际酢⑶度胧较低尤枫离散数学图像处理讲师注::⊙Ⅸ中国图书资料分类法》查询。—《学科分类与代码》。—
——基于图书网站的动态搜索阉鞯难芯顺序。两个因素同等重要,都可以反映际槭芑队某潭群拖矍榭觯摘要本文针对图书类网站的特点,根据表单项前的文字信息反映表单项输入信息,设计一种通过解析表单项动态填充表单的方法,利用动态解析表单获得结果页面,对其进行解析并加权排序,最后按照统一的显示格式展现。本文设计实现利用网站自身高级搜索页面对同一类型的多个网站进行线程方式解析查询接口所在页面提高处理性能;运用字典和表单项关键字链表,完成结果解析。要考虑的因素是该类似图书在不同网站的出现频数和在各个网站的排序检索的系统,为用户同时在多个图书网站搜索图书提供便利快捷的条件。实验结果验证了算法设计的正确性,本课题的主要研究工作包括:⑸杓埔桓龌谧值淦ヅ涞亩淼ニ阉魉惴ā8盟惴ú捎肧方式解析表单,避免前人采用绞浇馕霾拇罅课抻眯畔ⅲ焕枚进行匹配。服务器端程序通过抓取页面进行语义分析,发现新的图书网站和扩展关键字字典。⒃诒淼ザ畛浠袢〉慕峁∩希迪至私峁趁娼馕觥!ü预先了解并熟悉图书网站的搜索结果的展示页面的标签结构,将这种标签结构进行抽象提取,利用抽取模板进行解析获得图书信息对象的⒉檠峁笮怼6杂诮峁扯馕鰙旱慕峁罱信判颍
因此采用等值加权排序法。在以上工作的基础上,设计实现了一个基于图书网站高级搜索的动态表单搜索系统。该系统提供一种较为新颖的思路,对于同一类型的网站,通过其高级搜索页面进行精确查询项匹配。关键词:表单解析,动态填充,结果页面解析,:学位论义
一————、№甌Ⅸ,,,衎瓻瑃甌;,,—————————————————————————————————————————————————————一一
,卸盿琾畂.,
录目第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第二章查询接口相关技术分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第三章系统设计实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一第四章系统测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..课题研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.深层网的现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.选题及主要研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.查询接口抽取技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..查询接口匹配技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯总体结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯设计实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯