文档介绍:增量式时态关联规则算法研究及应用摘要规则。该算法主要是根据时态事件模型和序列模型以及鮫原近年来,随着计算机技术的发展和数据库技术的广泛应用,各行业都积累了海量的、以不同形式存储的数据资料,要从中发现有价值的信息或知识而达到为决策服务的目的,就成为非常艰巨的任务,数据挖掘技术应运而生。与此同时在现实生活中,我们发现大量数据集都带有显式或隐式的时间特性,因此时态数据挖掘的研究逐渐成为一个新的热点。由于时态数据的都有较强的时间性,即数据会随时间的变化而变化,原先已经挖掘出来的知识或模型可能不再有效,就需要重新挖掘,但这样原先的工作就白费了。因此,我们提出了一种时态约束下增量式关联规则挖掘算法,随着新数据的产生增量式地更新关联规则集,尽可能地只处理新数据并充分利用原先挖掘的则,快速更新算法思想基础上产生的,在实际应用中有很大的意义,不仅能对股票数据,也可对如银行数据,超市数据,气象数据等时态数据进行分析和研究。本文还结合了股票呃砺郏隽渴碧亓9嬖蛩惴ㄔ擞到股票数据关联分析中,最后得出了一些有趣的关联规则从而指增量,℃时态关联规则算法及应用;‘
导投资者选择投资策略。关键词:增量式更新,时态数据挖掘,时态关联规则,支持度,置信度浙江工业大学颀上学位论文增量,℃时态关联规则算法及应用
№、∑觥緀:,角:—,.瓵,、析】,ⅱ鬿瑃、Ⅳ甋穑甧瑃—,ⅱ鬳琣甌琭,,產.;撕籺;籧琣ⅱ鬳
刷醛氢绷搿鬻靠≈睁气稚《,矿月喝研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出法律责任。学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内和汇编本学位论文。本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的作者签名:本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存本学位论文属于⒈C芸冢年解密后适用本授权书。⒉槐C茑瘛朐谝陨舷嘤Ψ娇蚰诖颉啊獭,
髀引言髁斯系淖钚露ㄒ濉J萃诰也称为数据库中的知识发现侵复在现实生活中,我们通常会发现周边的事物或多或少有着这样那样的联系,很快就发现有太多的事物彼此相互联系,而且还有着许多种不同的关联。如果人了用计算机自动挖掘关联,于是就有了关联规则的概念。在数据挖掘领域中,关遍及经济、气象、通信、医疗等多个领域。股市每日蛟指数、交换机的每小出了时态关联规则算法。相对于数据挖掘较成熟的部分而言,时态数据挖掘的研为一个新的热点,算法研究的热点方向集中在分布式和并行计算方面,但国内在近年来,随着计算机技术的发展和数据库技术的广泛应用,各行业都积累了海量的、以不同形式存储的数据资料,要从中发现有价值的信息或知识而达到为决策服务的目的,就成为非常艰巨的任务,数据挖掘技术应运而生。.在驶嵋樯希現、蚐对数据挖掘数据中提取模式的过程,这些模式是有效的、新颖的、潜在可用的和易于理解的但通常这些联系都是隐而不显的。这就需要我们去挖掘这当中的关联,然而我们们手动去找出这些联系,则需要大量的人力资源和时间资源。因此,学者们提出联规则悄壳暗囊桓鲋匾Q芯糠较颍τ米钗9惴骸但传统的关联规则挖掘很少考虑关联规则的时间适用性,事实上所有的事物都有着时间属性,大量数据集都带有显式或隐式的时间特性。时态数据随处可见,时的业务量、某一患者的脑电波和车娜辗梦柿浚庑┒际潜冉铣<睦印也就是说事物之间的关联可能在不同的时间段下是截然不同的。因此,学者们提究是数据挖掘的较新的一个方向。目前,国际上对于时态数据挖掘的研究逐渐成这方面的研究文献尚不多见,研究主要集中在时态挖掘的理论框架上,比较重要的工作有年欧阳为民等曾经从理论框架的角度对时态数据挖掘做过的介绍和分析我们还发现事物是随着时间的推移而不断的发展的,不断的会有旧的事物灭亡,新的事物的产生,即不断会有旧的关联的灭亡,新的关联的产生。因此我们提出了增量式时态关联规则算法,通过不断增加新的数据,减少旧的数据,来挖掘事物之间最新的内在关联。由于时间是一个永远变化的量,因此如何去挖掘增量式的时态关联规则就显得尤为重要,它可适应大规模,动态数据,可实现并行处理等好处。目前处理增量式时态关联规则一般有两种方法,一是将增量的数据连同以前的数据重新挖掘生成关联规则,二是尽可能的只处理增量的数据,增浙江工