文档介绍:签字日期:ば汀唬口保密——月保密的学位论文在解密后应遵守此协议盗盘必开独创性声明关于论文使用授权的说明签字日期:.史::』:丑递:豪过网络向社会提供信息服务。本人电子文档的内容和纸质论文的内容相一致。论文的全部或部分内容。论文的公布ǹ授权南京信息工程大学研究本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。本论文除了文中特别加以标注和致谢的内容外,不包含其他人或其他机构已经发表或撰写过的研究成果,也不包含为获得南京信息工程大学或其他教育机构的学位或证书而使用过的材料。其他同志对本研究所做的贡献均已在论文中作了声明并表示谢意。学位论文作者签名:南京信息工程大学、国家图书馆、中国学术期刊馀贪杂志社、中国科学技术信息研究所的《中国学位论文全文数据库》有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文,并通除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ生院办理。指导教师签名:签字日期:
摘要用到菰吹姆掷嘀校岢隽讼喙氐乃惴ê湍P汀V饕Q芯抗ぷ靼ǎ檠涌谀J叫畔⒊槿〖际跹芯俊1疚幕谝趁嬉槐淼ツP停菰捶掷喾椒āL岢隽嗽诨诓檠涌谔卣方法以及改进的构架对于分类准确性的提高具有较好的效果。互联网按“深度”可以分为蚐K孀呕チM姆伤发展,大量信息在我们的日常工作和生活中不断产生和积累。为了利用这些资源,尤其是试矗Ы缫肓薉菁晌侍獾难芯俊6菰吹姆掷嘧魑狣菁芍械闹匾;方冢枰8喙刈和研究。本文针对菰捶掷嗨婕暗降南喙丶际踅辛搜芯浚ū咎逵提出对页面进行内容文本特征和超链接的提取,同时对表单特征提取进行了规范。之后进行预处理。咎骞菇ǚ椒ㄑ芯俊1疚母隽吮咎迥P停岷现M蚖来构建了几个领域的本体,同时提出了新的权重计算方法。诒咎宓腄分类的同时,将本体引入菰捶掷嗟姆椒ā2⒏慕朔植惚淼ナ侗架构和权重计算方法,形成了基于本体的菰捶掷嗨惴ā在实验平台上分别用.⒈匆端狗掷喾椒ā方法、支持向量机四种方法进行对比实验,实验表明,基于领域本体的菰捶掷啾已有的单纯利用查询接口特征进行分类的分类效果更好,同时改进的权重计算关键词:深网;本体;分类;领域识别
籓籆籌.:..甒印瓵.,,琒琣琣,琻甇..琫仃瓺瓵:—琲,,.瓸Ⅱ
目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..浴研究背景与现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.选题方向及该方向已有研究成果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本文的主要工作与结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⒒袢「攀觥舑盔⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一檠涌凇表单⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.畔⒒袢×⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.ü獭小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一第三章檠涌谔卣魈崛页面一表单模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一页面特征的提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表单特征的提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.空间向量模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⒔帷第四章基于本体的菰捶掷唷..
本体模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..≡⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第五章实验及分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一实验平台简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于查询接口文本的分类实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.引入本体后的分类实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.实验对比分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯虳男阅鼙冉稀新的分类器性能测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第六章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..本文总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯未来工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。致洹作者简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。
第一章绪论引言弟