1 / 49
文档名称:

基于数据流挖掘的相关算法研究.docx

格式:docx   大小:206KB   页数:49页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据流挖掘的相关算法研究.docx

上传人:sssmppp 2022/6/24 文件大小:206 KB

下载得到文件列表

基于数据流挖掘的相关算法研究.docx

文档介绍

文档介绍:基于数据流挖掘的相关算法研究
摘 要
随着计算机、通信、网络技术的发展,大量的信息数据在很多领域出现,如 交通工程和网络监控、通信数据管理、股票分析、电信记录分析、金融信息监控、 传感器网络监控等。目前,大多数的挖掘算法都是针对固定数据e fitting error of these two limiting conditions to determine the division of the time series key point. Experimental results show that the algorithm fitting result is good, it eliminates the interference of noise, and be able to pinpoint the mutation sequence Monotony turning point and find that the sequence of peak state. After selecting effective key points, we propose an improved Algorithm which based on a subsection extremum DTW algorithm - identify similar sequences of the key points based on DTW. In this paper, the algorithm will use the key points which selected with double-threshold into the DTW, The experiments show that algorithm has been greatly enhanced in calculating the time complexity, and overcomes the problem of the large algorithm with DTW, it also improves similarity measure efficiency on the subsection extremum DTW, and greatly enhances the efficiency.
Key words: Key point, Sub-linear, similarity search
第一章绪论 6
1数据挖掘的概述 6
1. 1数据挖掘的定义 6
8
数据挖掘的方法及应用 9
2时间序列数据挖掘的进展 10
3本文工作 13
第二章时间序列相似性挖掘研究现状及评述 14
1时间序列的定义 14
2时间序列相似性的概念 14
3相似性搜索的基本问题 15
17
4. 1时间序列的模式表示 18
4. 2 时间序列的相似性度量 20
5小结 24
第三章时间序列的线性分段 25
1引言 25
2时间序列线性分段方法的研究 26
2. 1 极值点拟合法 26
2. 2 特征点拟合法 27
2. 3 局部极值点法 28
2. 4 边缘点线性表示法 28
29
3. 1 相关定义 29
3. 2 关键点的检索 30
3. 3双阈值分段线性表示算法 31
3. 4实验 32
5小结 34
第四章时间序列的相似性度量 36
1引言 36
2 相似性序列查询 36
2. 1 欧氏距离度量 37
2. 2动态时间弯曲度量 40
3基于关键值的动态时间弯曲距离度量方法 44
3. 1相关定义 45
3. 2关键值动态时间弯曲算法 45
4实验 47
5小结 48
第五章总结与展望 49
1全文总结 49
2研究展望 49
参考文献 51
致 谢 错误!未定义书签。
第一章绪论

近几年来随着科学技术特别是信息技术的高速发展,人们在日常生 活、学****工作中经常会接到各种各样的数据信息。这些数据信息方便了人 们的生活,为人们处理日常的纷繁复杂的问题带来了便捷,但是也给人们 造成了一些不便,例如如何对信息进行有效的存储及数据信息安全问题 等。面对这些问题,人们开始考虑通过对掌握的数据信息进行深层次的分 析研究,达到充分利用这些数据信息的目的。当前与数据库管理系统相关 的技术如数据信息存储与数据查询等发展相对较成熟,现在的问题是尽管 有了这些成熟的技术,但是在这些数据信息内部包含的有价值信息人们至 今都不能有效的获取。为了解决该问题,人们在