文档介绍:刹檠低吃ご砉丶际跹芯张春丽分类号单位代码指导教师陈如亮职称教授学位授予单位大连海事大学申请学位级别学科ㄒ论文完成日期年答辩日期答辩委员会主席密级工学硕士管理科学与工程:·一一,●
,●
:“●,·
.、●、●
论文作者签名:狐寿雨导师签名:夕彭纱劳学位论文作者签名:丛盎盈保密口在——年解密后适用本授权书。大连海事大学学位论文原创性声明和使用授权说明日期:≯/晗缭耮原创性声明学位论文版权使用授权书撰写成硕士学位论文:世鹧蔡萌⒉殄蓉池酱Ρば唠ψ曹钟ひ3畚本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未公开发表的成果。本声明的法律责任由本人承担。本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。同意将本学位论文收录到《中国优秀博硕士学位论文全文数据库》泄跗诳光盘版缱釉又旧、《中国学位论文全文数据库》泄蒲Ъ际跣畔⒀芯克等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于:不保密圈一,朐谝陨戏娇蚰诖颉啊獭
◆、●·●
摘要随着信息化技术的发展,人们越来越倾向于从网络上获取资源。传统搜索引擎能够检索到的网络资源称为稣颊鯳资源的很少一部分。那些隐藏在菘庵校刻峤徊檠啥趁婊袢〉淖试闯畔⒑看螅煊蛳喙囟惹浚绾胃咝У幕袢≌庑┳试闯为当前研究的关键问题。刹檠低呈怯赏煊虻腄肟诩傻囊桓鋈ň植檠口,通过对这个集成接口提交查询,可以同时检索到不同菘庵械淖试础预处理阶段是系统集成过程中的初始阶段,它主要分三步进行:肟诘姆⑾帧查询接口模式抽取、查询接口集成,其最终结果的好坏对后面查询处理和结果处理有着重要影响。因此上述预处理阶段各个步骤采用哪种技术能够获得更高的效率是本文研究的出发点。本文的主要研究工作如下:檠淼サ奶卣鳎攵韵纸锥蜽入口发现技术的优缺点,提出将多分类器聚焦爬行技术应用到肟诜⑾稚希氐愀龈鞣掷嗥鞯实现方法,并介绍了种子难∪〔呗裕桓莶檠淼シ掷喙痰钠舴⑹焦嬖提出采用基于决策树的表单分类方法,区分出那些非肟诘牟檠淼ァ芯縒入口的模式特征,针对页面的结构性特征提出基于树和韵竽P偷哪J匠槿》椒ǎ紫韧ü辰馕銎鹘ń涌谝趁娼馕龀蒁树结构,然后遍历髡页鍪粜栽K丶捌涠杂Φ谋昵詈笥肈对象模型将查询接口的模式信息表示出来。冉舷钟心J狡ヅ浼际醯挠帕邮疲攵圆檠涌谑粜栽K氐奶氐悖岢龌于语义的模式匹配方法,该方法从简单匹配和复杂匹配两个角度分别给出了属性相似度的计算公式,使得模式匹配具有更高的效率。针对所提出的预处理阶段相关技术,本文分别设计了具体实验,用实验结果证明上述各个方法的有效性。关键词:篧入口发现;模式抽取;模式匹配中文摘要鳶为治隽薉
●、●
,瑆甒甈瓺琲簍甒英文摘要甌,.琿瞗:,■
篋籛英文摘要,;·■