文档介绍:东北财经大学
硕士学位论文
时间序列的相似性挖掘及其在股票时间序列中的应用
姓名:郑继萍
申请学位级别:硕士
专业:企业管理
指导教师:刘忠玉
20071201
摘要时间序列数据就是按时间先后顺序排列各个观测记录的数据集,广泛存在于社会、经济、技术等领域中。它不仅仅是历史事件的记录,更重要的是蕴藏其中的不显现的、有趣的模式。在时间序列数据库越来越大的今天,如何对这些海量数据进行分析处理,挖掘其背后蕴藏的价值信息,对于人们正确认识事物和科学决策提供依据具有重要的实际意义,对时间序列的数据挖掘的研究显时问序列分析的一个重要研究方向是采用数据挖掘的方法来揭示数据内部规律。相对于数据挖掘较成熟的部分而言绻叵凳菘庵泄亓9嬖蚝头掷喙嬖的挖掘等奔湫蛄惺萃诰虻难芯炕故粲谑萃诰蜓芯苛煊蛑幸桓鼋闲碌姆目前对于时间序列数据挖掘的研究主要集中在相似性搜索和模式挖掘上。相似性搜索是时间序列数据挖掘的研究基础,因为无论是分类、聚类还是关联规则挖掘,都需要解决时间序列的相似度问题,相似性搜索是时间序列数据挖掘的研究基础。在相似性搜索研究中存在的主要问题是时间序列数据量过大,线性化结合,提出了一种基于关键点的时间序列分段线性化表示方法,该方法从原始序列中提取关键点弦欢ㄌ跫慕绫,以关键点来作为分段的界线,以最大似然函数和最小二乘法来拟合各分段线性拟合函数。该方法结合了两种序列表示方法的特点,同时考虑了时间序列数据内在的整体特征,而且保留各分段在时间序列中的位置信息。在分段线性化表示的基础上文章又提出了~种相似性计算方法,该方法对于时间序列的多种变形都不敏感。股票市场的技术分析一直是一个热门的研究课题,人们提出了各种不同地方法来预测股市的走势。技术分析中一个经典组成部分是形态分析。不同的形态有着不同的意义,形态的背后常常蕴含着一定的规律,往往预示着股票价格的未来走势,如头肩项是一个长期趋势的转向形态,通常出现在牛市的尽头,股价开始出现滞涨,形态分析目的是预测市场价格变化的未来趋势、为股票投得愈发必要。支。一个有效的解决办法是对时间序列进行重新描述,减小数据量,人们已经提出了几种时间序列的描述方法。本文第三章在前入的基础之上将界标模型与分段
资者决策提供依据。文章最后将在相似性挖掘研究的基础上讨论一个基于数据挖掘技术进行证券市场的技术分析的方法。该方法通过应用时间序列的相似性搜索来寻找股市的走势模式,从而进行股市指数等有关变量的预测。本文的创新点主要表现在:在前人研究的基础之上,将界标模型和分段线性化进行了结合,以关键点闾跫慕绫作为分段依据,以最大似然函息、能够滤去实际时间序列中的噪声。文章另一个创新点是将时间序列相似性挖掘技术运用于股票时间序列的分析之中。关键词:相似性挖掘,分段线性化,界标模型,股票时间序列,形态分析数和最小二乘法来拟合各分段线性拟合函数;优点在于符合人体生理实验结果,考虑了时间序列数据内在的整体特征,而且保留各分段在时间序列中的位置信Ⅱ
.,.’琣..琧畁,,.,甋.’..甌’
畁簊,瑃,...琾.
《置恻龅概雠堆嫡疆鲥啦雌舡哼懒汁柏摩罔》,是本人在导师指《醇两度孙懒辟摊艮筻在僻谤忡群瘟幂》系本人在东作者签名:垡哗年知掏酰日期:锄阥旅婺暂继牟东北财经大学研究生学位论文使用授权书日期:蛳辏琽月面目日期:砷阩挛帷H东北财经大学研究生学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文导下,在东北财经大学攻读硕士学位期间独立进行研究所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果,对本文的研究工作做出重要贡献的个人和集体均已注明。本声明的法律结果将完全由本人承担。北财经大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归东北财经大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解东北财经大学关于保存、使用学位论文的规定,同意学校保留并向有关部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人授权东北财经大学,可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。作者签名:导师签名:
第一章绪论选题的研究背景与研究意义发展、应用有众多原因,便列举了四个主要理由:超大规模数据术,例如更快和更大的计算能力和并行体系结构;经营管理的实际需要;对这序列的数据挖掘的研究显得愈发必要。而股票时间序列就是一个典型的时间序本章首先从数据挖掘的角度出发简要回顾了时间序列的发展,然后重点介绍时间序列数据挖掘的研究现状。同时介绍了有关时间序列数据挖掘的各个研究方向,并对此做出评述,指出今后的研究方向。数据挖掘是一门交叉学科,它汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域,近年来受到各界广泛关注。促进数据挖掘诞生、库的出现,例如