文档介绍:摘要关键词:时间序列数据,部分周期模式挖掘,最大子模式命中算法,层状作为时间序列数据挖掘的前沿领域,时间序列周期模式挖掘研究有着重要的理论价值和现实意义,而部分周期模式挖掘和增量挖掘是其研究的重点和难点,为此,本文选择时间序列部分周期模式挖掘作为主要对象进行研究。本文首先综述了时间序列数据挖掘和时间序列周期模式挖掘的研究现状,指出研究的理论价值和现实意义。之后,给出时间序列、周期、部分周期、模式的工长度、增量时间序列的基本概念,并重点分析了灾始盎谄湫灾实类惴ā⒆畲笞幽J矫兴惴ê驼卧隽克惴算法U庾魑H研究的基础,贯穿于时间序列部分周期模式挖掘和增量挖掘分析的全过程。在回顾最大子模式命中算法之后,鉴于最大子模式树的特点和不足,本文提出一种层状链式图结构,对传统的最大子模式树算法进行了改进,利用仿真试验对比了两算法的时间复杂度。最后,本文还利用层状链式图对增量时间序列的部分周期模式挖掘进行了研究。基于算法思想提出的层状链式图部分周期模式增量挖掘算法,继承了层状链式图的存储特性和对频繁模式分离的优势,但是层状链式图也有局限性。在层状链式图的增量挖掘算法应用仿真中,本文重点研究它同非增量挖掘思想的优势及考虑置信度变化时的算法伸缩性效率。本文创新点在于提出一种层状链式图结构,将它代替最大子模式树来存储命中模式集。层状链式图是根据模式的三长度分层存储命中模式,它不需要按照直接可达祖先思想创建路径的节点,因此减少了非命中模式节点的存储。同时在模式分离时,算法通过搜索某一模式的超模式层达到减小匹配空间的目的。另外,从理论上分析,层状链式图可以应用于增量时间序列的频繁模式挖掘,尽管在层状链式图的更新效率不及树状结构,但是它延续了在其存储和分离频繁模式等方面的优势。链式图,增量挖掘
知识水坝为您整理
甌.,猯ぁ猻.,琁瓾,瑃.,,,.,,琤—甀琤瓵,猻..琒,珻
知识水坝为您整理
溉⋯一繇珈/烈唬衡ぱ迥瓿г隆稳聊躲猩雅签字日期:沙庐迈签字日期菔锬自独创性声明学位论文版权使用授权书或撰写过的研究成果,也不包含为获得苤盗盘堂或其他教育机构的学位或证本学位论文作者完全了解苤生盘堂有关保留、使用学位论文的规定。特授权丕鲞盘鲎可以将学位论文的全部或部分内容编入有关数据库进行检本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得学位论文作者签名:日/
第一章绪论研究的背景目的和意义随着信息技术的发展,人类由工业化时代逐渐步入信息化时代。数据库理论和应用的成熟以及数据仓库技术的广泛应用,使人们在日常事务处理和科学研究中积累了大量的各种类型的数据。这些数据涉及到科学研究、医疗保险、商业、电信业、金融业、制造业、互联网、信息安全到政府决策等各个应用领域。如何充分有效地管理和利用这些海量数据、发现这些数据背后隐含的规律和知识,成为人们目前非常关注的问题。生活中的每天都产生大量的数据,但是人们从存取的数据中所获得的信息量十分有限,大多隐藏在数据背后的关于数据特征描述,趋势预测和对科学决策具有重要参考价值的信息却未被发现。因此,人类目前陷入“丰富的数据”和“贫乏的知识”并存的尴尬境地。于是,人们亟需一种能够从大量的数据中找到有用的信息和知识的方法,从而有助于使用者及时准确地做出科学的经营决策,以适应环境的迅速变化。同时,这种技术还应适应现实世界中数据的多样性,比如说:海量、含噪声、不完整、动态、稀疏性、异质、非线性等,在这些要求下,数据挖掘技术乜儿应运而生。数据挖掘就是利用统计、机器学习、软计算方法ㄉ窬纭⒋旨砺邸模糊逻辑、进化计算等⑹菘狻⑼窦际醯雀鞲鲅Э屏煊虻南冉际醵源罅历史数据进行分析处理,从中提取出隐含的、事先未知的和有价值的知识,为人们的决策分析提供更高层次的技术支持。目前数据挖掘研究已由结构化数据转向半结构化和非结构化数据,由事务数据转向文本数据、时态数据、空间数据和多媒体数据,由同构数据转向异构数据,由集中式数据转向分布式数据、由静态数据挖掘转向动态数据挖掘。针对各类复杂类型数据的挖掘理论、技术及应用的研究己成为当前挖掘研究的重点和难点口,。时间序列数据是指按时间顺序排列的观测值集合。这里的“时间”具有广义坐标轴的含义,指按时间的先后顺序排列的数据,例如产品销售记录数据、股票价格数据、水温记录数据等啼J奔湫蛄惺且焕喔丛永嘈褪荩的显著特征是:对象之间保持着严格的时间顺序∞】。时间序列在人类社会的各个领域中都广泛存在。时间序列数据