文档介绍:摘要出了关联规则的价值衡量方法。在基本理论分析的基础上,深入探讨了多维关联规则和序列模式关联的研究成果和应用情况,并针对研究规则算法和带时间约束的序列模式关联算法。改进算法比原算法提高随着数据库应用的不断深化,数据库的规模急剧膨胀,人们需要对这些数据进行分析,从中发现有价值的信息。但是数据库管理系统本身却没有提供有效的工具和方法来利用这些数据,因此数据挖掘成为当今研究的热点。数据挖掘中关联规则的挖掘获得了广泛的关注,它是从历史数据中发现项集之间的相互联系,提取出有用的和感兴趣的模式。本文即对数据挖掘中的关联规则进行系统研究。关联规则的基本理论和分类方法,介绍了经典的惴ǎ⑻中的重点提出了改进算法,即基于垂直数据分布和等价类的多维关联的特征分析中,详细阐述了客户特征数据挖掘的流程设计、数据选取和具体实施,最后对挖掘的规则进行了分析,并对模型提出了改进设关键词数据挖掘,多维关联规则,序列模式,电信,客户流失作者综述了国内外关联规则的研究现状和应用成果,深入分析了了挖掘效率,同时更加灵活,并能适应实际数据挖掘中用户的特定需求。最后,作者将改进的多维关联规则算法应用于移动公司流失客户想。
瓸蟛印印琺,,.,.,,.瓵,瑃甌’
日期:堕年旦月笪日式苟作者签名:盛笪导师签名月一日关于学位论文使用授权说明原创性声明论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位文:学校可根据国家或湖南省有关部门规定送交学位论文。共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:本人了解中南大学有关保留、使用学位论文的规定,即:学校/
第一章导论篓二童量丝堡圭堂堡笙塞引言分。据国外专家预测,在今后的昴冢孀攀萘康娜找婊垡约凹扑着应用的深入,它逐渐得到了人们的重视,目前的序列模式挖掘算法数据域过随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行导致了“数据爆炸但知识贫乏”的现象。正是在这种情况下,数据挖掘机的广泛应用,数据挖掘将在中国形成一个产业“。。年翴发布了关于信息存取工具市场的报告,其中年的数据挖掘的市场大概是亿美元,估计在下个昴谑谐〉⑶以げ獯耸谐≡晔被岽锏诿涝!啊!K孀数据挖掘应用领域的发展和成熟,市场份额将继续加速增长。是其中十分重要的组成部分。则的问题后,关联规则的研究出现了一个热潮。它最早解决的问题是购物篮分析,就是在超市的交易数据库中发现顾客购买物品间的相关性。但是关联规则算法仍然存在着一些问题:第一,关联规则的发现算法主要集中在事务数据库的应用上,但是目前数据库系统中应用最广泛的是关系数据库,它和事务数据库的结构和处理方法存在着相当大的区别,事务数据库上关联规则算法如何改进以应用到关系数据库中急待解决。第二,传统的关联规则挖掘研究集中在事务项集的基础上,它主要是布尔型或类别型属性,对于关系数据库中大量存在的多维属性,传统的关联规则挖掘算法对它们的处理仍显得薄弱。关联分析中另一个挖掘的主要目标是序列模式的挖掘,它是发现时序基础的模式关联。随于宽泛,需要引入必要的约束条件进行限制。本论文就是基于关联规则中多维问题的提出更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的联系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏知识的手段,技术应运而生。有关调查显示,数据挖掘市场是目前数据库市场中最重要和发展最快的部在数据挖掘中,关联分析关联分析的主要目标是发现关联规则。自从鎍晏岢鐾诰蚬亓9丑%,.
关联和序列模式关联这两个重要的应用领域进行研究的。,疚牡难芯勘尘本文的主要研究背景如下:扑慊际醯姆伤俳自从年世界上第一台计算机问世以来,计算机的硬件发展迅速,从最初的电子管到随后的晶体管,直到目前的大规模集成电路芯片的应用,硬件性硬件的发展也同样促进了软件的发展。过去的年中,计算机稳定的、令人吃惊的进步导致了功能强大的计算机、数据收集设备和存储介质的大量供应。这些技术推动了数据库和信息产业的发展,大量数据库信息被用于事务管理、信息检索和数据分析。因为计算能力的大幅度提升,数据挖掘所需的大量计算和实时分析成为可能。人们可以利用先进的计算机软件及硬件技术发现数据问自世纪年代以来,数据库技术得到迅速发展,新的数据库系统层出