1 / 112
文档名称:

基于浓缩数据立方的数据立方梯度挖掘研究.pdf

格式:pdf   页数:112
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于浓缩数据立方的数据立方梯度挖掘研究.pdf

上传人:qujim2013 2013/7/6 文件大小:0 KB

下载得到文件列表

基于浓缩数据立方的数据立方梯度挖掘研究.pdf

文档介绍

文档介绍:华中科技大学
博士学位论文
基于浓缩数据立方的数据立方梯度挖掘研究
姓名:刘玉葆
申请学位级别:博士
专业:计算机软件与理论
指导教师:冯玉才
20031109
.要摘性,能够支持更复杂、更广泛的假设分析。因此,数据立方梯度挖掘能广泛地应用于罔绕数据立方梯度挖掘的三个关键技术即数据立方梯度挖掘算法、数据立方梯度在数据立方梯度挖掘算法方面,主要研究了约束性立方梯度挖掘算法。为了从数据立方中挖掘出用户真正感兴趣的数据立方梯度,约束性的挖掘是一种比较有效的方围,给出了算法在多种关系间的梯度、梯度元组约束条件、区间上的梯度、袁黔磐若、哥妤同意随着数字时代的到来,数据的积累正在呈爆炸性的增长,人们积累了海量的数据资料。如何从这些海量的、繁杂的数据中提炼有用的知识成了一个备受关注的研究课题。于是,数据挖掘技术作为一种崭新的研究和应用领域出现了。数据立方梯度挖掘是数据挖掘领域的一个新的、重要的课题,它是传统的关联规则挖掘在数据立方上的推广。由于充分利用了数据立方中的聚集信息,数据立方梯度比关联规则更富于表达市场营销、零售、金融、制造、政府和军事等领域。查询以及数据立方梯度挖掘工具,我们开展了四个方面的研究工作:约束性数据立方梯度挖掘研究、实例化数据立方中约束性立方梯度挖掘研究、数据立方梯度查询语言研究、在线梯度挖掘工具研究。本课题的研究成果不仅丰富了数据立方梯度挖掘研究理论而且为国产的达梦数据库管理系统研制通用的数据立方梯度挖掘工具打下坚实的法。:组对。惴ㄊ窍钟械谋冉细咝У乃惴āNA思跎貺算法的搜索空间进一步提高算法效率,我们利用浓缩数据立方的大小以及其计算时间比较小的特点,提出了基于浓缩数据立方的梯度挖掘算法。算法是惴ㄔ谂缩数据立方上的推广,比惴ǜ哂幸话阈浴N颐抢┱沽薒算法中活动集的定义使之包含了单元组的情况并且通过两个关于活动集生成的基本定理使得算法获得了与惴ɡ嗨频乃蚣糁τ呕啤A硗猓颐且蔡岢隽艘种新的优化技术即单元组部分扩展技术,该技术有效地减少了单元组扩展集的大小以及梯度一探测元组对生成过程中元组之间的比较次数。为了扩大了算法处理问题的范不同的梯度函数四个方面的扩展,这些扩展可以通过修改算法的相关部分来实现。基于合成数据集的对比测试表明了算法性能要比惴ǜ摺对实例化数据立方中的约束性立方梯度挖掘问题进行了研究并且给出了基于浓缩基础。韧晃墓ú
数据立方的挖掘算法。利用我们给出的问题形式化定义,与非实例化数据立方中约束性立方梯度挖掘问题进行了比较,指出了它们的不同之处在于两者的研究问题条件不同。前者给定的是已经计算好的数据立方,而后者给定的是用于动态计算数据立方元组的关系表。相似之处是两者的目的一样,都是发现感兴趣的梯度一探测元组对。通过具体例子详细地描述了算法过程。算法采用了排序和单元组部分扩度、梯度元组约束条件、区间上的梯度、不同的梯度函数网个方面的扩展并与相关研究进行了比较,主要比较了我们研究的问题同相关研究问题的相似和不同之处。在合在数据立方梯度查询语言方面,我们指出了现有梯度查询语言查询空问大,效率低的不足并且提出了一种基于浓缩数据立方的新的梯度查询语言语言。为了支持镅圆檠粤⒎教荻韧诰蛩惴╡虶隽艘恍修改,这些修改可以通过算法和算法输出部分的修改以及算法的扩展来实现。基于和算法生成的数据立方元组个数,我们给出了语言的一个查询代价模型。镅圆檠砉贪ㄓ锓ǚ治觥⒂镆寮觳椤⒉檠计划、查询执行四个主要步骤。给出了查询语言物理上的优化技术即浓缩数据立方索引的结构。我们扩展国产的达梦数据库管理系统来实现镅圆⑶腋隽诵枰扩展的功能模块,包括核心层需要扩展的七个模块以及涌谛枰@┱沟奈甯瞿?椤在数据立方梯度挖掘工具方面,我们研究了在线分析处理与数据挖掘集成的在线分析挖掘系统系统。在分析了传统系统的不足之后,提出了在线梯度挖掘逴低巢捎昧嘶贐/J降娜闾逑到峁梗ǹ突Ф恕⒂用层、数据服务层。系统的实现是基于际酢技术以及吉。系统采用松散耦合方式与困产的达梦数据库管理系统集成。关键词:数据立方;浓缩数据立方;数据立方梯度挖掘:数据立方梯度查询;在线梯展的优化技术。为了扩大算法处理问题的范围,给出了算法在多种关系间的梯成数据集上对算法的性能进行了测试,测试结果表明了算法的有效性。度挖掘儿
瑆,琺,.甀...,皐’,瑂,畉瑃:,,甀..甌—
—,,猺瑃,..,瓵瑃—琁
珻甌,.瑃.,,甧.,瓵疭琲.:;;;,,甌琣
髀研究背景、目的及意义当数据挖掘技术如火如荼的发展和成熟时,数据库中的另一项新技术——数据仓息所淹没却因知识而饥饿C娑院祈滴藜实氖莺Q螅嗣窃诤艋揭恢中碌募际酰制造业、商业、医药、电信、体育、政府和军事等各个领域。