1 / 84
文档名称:

关联规则挖掘算法研究与应用.pdf

格式:pdf   页数:84
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘算法研究与应用.pdf

上传人:钻石文档库 2013/9/14 文件大小:0 KB

下载得到文件列表

关联规则挖掘算法研究与应用.pdf

文档介绍

文档介绍:江苏大学
硕士学位论文
关联规则挖掘算法研究与应用
姓名:陈晨
申请学位级别:硕士
专业:计算机应用技术
指导教师:鞠时光
20091216
摘要数据挖掘是指从大量的、不完全地、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程,数据挖掘的研究已经取得了重大的进展,而且被应用到众多的领域。关联规则挖掘是数据挖掘研究中一个重要课题,它主要用于从给定的数据集中发现频繁出现的项集模式知识。本文首先介绍了数据挖掘的任务和过程以及它的应用情况和发展趋势,关联规则挖掘的基本概念、分类方法和经典算法,然后重点对如何高效挖掘最大频繁⒍匀绾胃咝诰蜃畲笃捣毕罴辛搜芯浚攵韵钟兴惴ㄖ写嬖诘男枰超集检测和递归的建立条件频繁模式树问题提出基于有序树和呗酝诰步修改了用于挖掘的数据结构,提出基于含叶子结点链的有序树挖掘最大频⒍陨晒亓9嬖虻姆椒ń辛搜芯浚攵曰旧煞椒ǖ贾碌摹肮嬖虮⒎治隽擞肕算法挖掘整个事务数据库的最大关联规则存在的问题,⒍匀哂喙嬖蛭侍饨辛搜芯浚岢鲆恢衷谔囟ㄇ榭鱿赂萃诰虺龅膉关⑸杓撇⑹迪至私詹凭耙导际跹г航萄兰坌畔⒎治鱿低场江苏大学硕士研究生学位论文项集、生成关联规则以及缩减规则的规模进行了研究,对根据得到的币规则挖掘隐含的负规则进行了探讨,最后设计并实现了江苏财经职业技术学院教学质量评价分析系统。本文的主要工作和研究成果如下:最大频繁项集的算法,对算法的性能和效率进行了分析和实验验证。⒄攵訫惴ㄖ行枰7锤醇焖飨嗤钅拷岬懔从跋焱诰蛐实奈侍饨繁项集的驣算法,通过实验对算法的性能和效率进行了验证。炸”问题分析了现有缩减规则规模方法中存在的问题,提出了最大关联规则的概念,类似于用挖掘最大频繁项集取代挖掘完全频繁项集,用挖掘最大关联规则取代挖掘所有的关联规则,提出基于候选规则队列集结构挖掘单个最大频繁项集的最大关联规则的惴ǎ⒂檬道运惴ǖ男阅芙辛搜橹ぁ提出了挖掘整个事务数据库最大关联规则的惴ǎ运惴ㄔ诓煌榭鱿掠选取的策略进行了论证,并通过实例对算法的性能进行了验证。联规则直接获得隐含的置信度更高的负关联规则的方法。关键词:数据挖掘,关联规则,最大频繁项集,最大关联规则,隐含负规则
疭甌江苏大学硕士研究生学位论文甀...琣甊甅畆.,琣,,瑃甀.—痠.
江苏大学硕士研究生学位论文疭,琺琧瓵,.甊瓺:,
独创·生声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容以外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日
学位论文版权使用授权书保密口,不保密。本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。在年解密后适用奉授权书。本学位论文属于学位论文作者签名:导师签名:签字日期:年月日
第一章绪论数据挖据概述随着以计算机和网络技术为代表的信息技术的发展,越来越多的企业、政府组织、教育机构和科研单位实现了信息的数字化处理。大型数据库,特别是数据仓库已被广泛地应用于企业管理、产品销售、科学计算和信息服务等领域,由此方面,面对庞大的飞速增长的数据量,人们需要新的处理工具,以便能自动化地着许多重要的信息,人们希望能够对已经占有的信息进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统虽然可以较好地实现数据的录入、查询和统计等功能,但尚不支持对海量数据背后重要信息的挖掘,从而导致了“数据它不但可以帮助人们从数据库特别是数据仓库的相关数据中提取出所感兴趣的知识、规律或更高层次的信息,而且也可以帮助人们从不同程度上去分析它们,据的发展过程,而且还能进一步预测末来的发展趋势。因此,数据挖掘技术成为一个新的、日益受到重视的热点研究领域。目前在国内外的许多高校和研究机构都在从事此领域的研究工作,并产生了大量的研究成果。揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程,⑾止讨幸桓鎏囟ǖ牟街瑁且幌盗屑际及其应用,或者说是对大容量数据及数据叵到锌疾旌徒5姆椒ḿK目标是将大容量数据转化为有用的知谚托畔ⅰD壳埃萃诰蚣际跻丫谛矶江苏大学硕士研究生学位论文而引起的数据量快速增长,对数据库的存储、管理和分析提出了更高的要求:一把搜集的数据转化为有价值的信息和知识;另一方面,剧增的数据中有可能隐藏丰富,知识贫乏”南窒蟆数据挖掘,简称际跽窃谏鲜龅挠τ靡G笙虏摹从而可以更有效地利用数据库或数据仓