1 / 36
文档名称:

基于XML的树型结构编码及结构相似性匹配方法.pdf

格式:pdf   页数:36
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于XML的树型结构编码及结构相似性匹配方法.pdf

上传人:cherry 2014/5/18 文件大小:0 KB

下载得到文件列表

基于XML的树型结构编码及结构相似性匹配方法.pdf

文档介绍

文档介绍:⑨东北埽茁大莩硕士学位论文基于氖餍徒峁贡嗦爰结构相似性匹配方法分类号:猙东北师范大学学位评定委员会年学校代码:业级:玉研究生学号:±作者:郑伟卫金茂副教授电路与系统智能计算学历硕士密指导教师学科专业研究方向学位类型
摘要用户需求检索出用户所需要的信息。为此,本文作者从以下几个方面进行研究和探讨:随着的快速发展,网上的数据量不断增加,人们对网上信息的应用需求也不断提高。但是传统的畔⒉檠蠖嗍腔贖镅缘模捎贖谟镆灞示方面上存在一定的缺陷,导致了跋喙丶际醯目焖俜⒄埂H绾味曰赬文档数据快速地、有效地、全面地进行信息搜索,并进一步挖掘结构及语义信息,成为人们急需解决的课题。本文针对这一问题,提出了一种对基于Ⅻ牡档氖餍徒峁菇斜嗦氲方法,采用编码形式对数据源进行信息查询,并对查询结果进行结构相似性匹配,按照首先,本文介绍了检索技术的发展现状,对信息检索技术的各种方法进行了回顾,简述了对基于文档的树型结构进行匹配的基本原理与分类。其次,本文在分析了查询过程中的两类查询方法后,提出了一种查询方法,在保持了牡凳餍徒峁沟幕∩辖兴饕昙也就是进行编码缓蠼薪岬悴檠将满足匹配原则的结点析出,从而保持结点间的结构关系,通过文中给出的匹配度计算公式计算其匹配度,将满足用户需求的结果反馈给用户。然后,本文通过举例分析说明了本方法的特点:笔菰捶⑸浠保杉跎僦匦律璧氖萘浚檠讨校梢允褂没宄亓私獾矫恳徊浇岬阈畔⒌牟檠榭觯疚牡牟檠椒ㄊ窃诓檠行Ы岬愕幕∩辖薪峁瓜嗨菩缘钠ヅ洌簿褪窃诒证查找出用户需求信息的基础上,对这些信息的结构进行匹配,所以本方法保证了一定的查准率和查全率。最后,本文还对树的拓扑、子树的查询与树的剪枝等问题进行了探讨,以实现智能化信息检索。关键词:;结构相似性;结点编码;匹配度
雛嘶緀锄鰁姗肌衄簍祄鮪磂’僦鬭弭—锄簍籲琫衢琣珊,印餷蟆痮猠.,订痯篨;,猼琱瓵仃七鋏甌畁、痳甌琓订,Ⅱ℃’;掣瓸廿廿,廿騟:琣緇琱,:畁】.甀陁晟玞瑃琺
学位论文作者签名:避指导教师签名一。;塑:盗盛日期:.型£笸;』期;塑五』:£裁焕鹬鳎痕獭独创性声明学簋论文舨权使用授权书本人声镧掰呈交静学应论文怒本久在嚣拜指导下进行静磺究工作及敬得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其囊熟人已经发表或撰写过的磺究成果,也不包含为获褥东二爆菠大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:本学位论文馋者完全了解东爆范大学有关绦餐、使用学位论文懿媛定,即:东北师范大学有权保留并向国家翁关部门或机构送交学位论文晌复印件和磁盘,允许论文被查阅和借阅。本人授权东北师范大学可以将学整论文教全都或部分蠢容缡入鸯关数据瘁遂行捡索,霹鞋采霜影印、缩窝或熊它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎箦逵帽臼谌ㄊ学短论文佟者擎受螽去淘:工作单位:通讯地址:基电话:邮编:
第一章引言数据挖掘的概念【基于氖萃诰数据挖掘的产生数据挖掘的基本任务。分类——预测学习功能的发现,此功能将一个数据项分到几个预定义类中的一类:回归——预测学习功能的发现,此功能将一个数据项映射到一个真实值预测变量;聚类——一种普通的描述性任务,寻求以确定有限的一组类别或类来描述数据;总结概括——一项附加的描述任务,寻找对数据或子集的简单描述方法;关联建模——发现描述变量之间或者数据集或其一部分的特征值之间的重要的相变化和偏差检测——发现数据集中最重要的变化。随着科技的进步,信息产业的发展,人们进入了一个崭新的信息时代。网络和存储技术的迅猛发展,使数据的传播和积累速度在各个领域内不断提高。与此同时,众多领域内各自的数据库的规模日益扩大,信息量也随之急剧增加,人们意识到隐藏在这些数据之后的更深层次、更重要的信息能够描述数据的整体特征,可以预测发展趋势,这些信息在决策生成的过程中具有重要的参考价值。面对海量的数据库和大量繁杂的信息,如何才能从中提取有价值的知识,进一步提高信息的利用率,由此引发了一个新的研究方向:基于数据库的知识发现跋嘤Φ氖萃诰蚶论和技术的研究基于数据库的知识发现淮适紫瘸鱿衷昃傩械牡谑唤霢术会议上,其后在捌渌胧菘饬煊蛳喙氐墓驶嵋上也举行了ㄌ庋刑只帷H嗣歉鳮下过很多定义,目前公认的定义是由等人提出的。基于数据库的知识发现侵复哟罅渴葜刑崛∮行У摹⑿掠钡摹⑶痹谟杏的、最终可被理解的模式的非平凡过程。从宏观上看,讨饕S腥龉套槌桑菏菡恚萃诰蚝徒峁慕馐推估。数据挖掘是Ⅺ过程中的一个重要步骤,其中包括特定的数据挖掘算法。关性的本地模型;随着互联网的快速发展,网上信息急剧增长,但当我们为拥有极其详尽的信息的同蜡
Ⅳ痪哂凶悦枋鲂裕篐皇且恢直泶锏募际酰⒉灰欢芙沂中所揭示的含义。举一个最简单的例子,縠这句