1 / 89
文档名称:

第六章数据挖掘基本算法-2.ppt

格式:ppt   大小:675KB   页数:89页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第六章数据挖掘基本算法-2.ppt

上传人:落意心冢 2022/8/13 文件大小:675 KB

下载得到文件列表

第六章数据挖掘基本算法-2.ppt

相关文档

文档介绍

文档介绍:第六章数据挖掘基本算法-2
数据仓库与数据挖掘
第一章 数据仓库与数据挖掘概述
第二章 数据仓库的分析
第三章 数据仓库的设计与实施
第四章 信息分析的基本技术
第五章 数据挖掘过程
第六章 数据挖掘基本算法
第七章 非结构化数据挖次数越多则随机性弱化越多,累加次数足够大后,可认为时间序列已由随机序列变为非随机序列。
一般随机序列的多次累加序列,大多可用指数曲线逼近。
累减将原始序列前后两个数据相减得到累减生成列,累减是累加的逆运算,累减可将累加生成 列还原为非生成列,在建模中获得增量信息。
一次累减的公式为:
(4)灰色预测模型
关联度
关联度分析是分析系统中各因素关联程度的方法,在计算关联度之前需先计算关联系数。
关联系数

则关联系数定义为:
(4)灰色预测模型
式中:
为第k个点

的绝对误差;
为两级最小差;
为两级最大差;
ρ称为分辨率,0<ρ<1,一般取ρ=。
对单位不一,初值不同的序列,在计算相关系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。
(4)灰色预测模型
关联度

的关联度为:
(4)灰色预测模型
一个计算关联度的例子
工业、农业、运输业、商业各部门的行为数据如下:
工业
农业
运输业
商业
参考序列分别为X1,X2 ,被比较序列为X3,X4,试求关联度。
(4)灰色预测模型
以X1为参考序列求关联度。
第一步:初始化,即将该序列所有数据分别除以第一个数据。得到:
(4)灰色预测模型
第二步:求序列差
第三步:求两极差
(4)灰色预测模型
第四步:计算关联系数
取ρ=,有:
从而:
(4)灰色预测模型
第五步:求关联度
计算结果表明,运输业和工业的关联程度大于农业、商业和工业的关联程度。
x2为参考序列时,计算类似,这里略去。
(4)灰色预测模型
GM(1,1)模型的建立
设时间序列
有n个观察值,
通过累加生成新序列
则GM(1,1)模型相应的微分方程为:
其中:α称为发展灰数;μ称为内生控制灰数。
(4)灰色预测模型
设 为待估参数向量,
可利用最小二乘法求解。解得:
求解微分方程,即可得预测模型:
(4)灰色预测模型
模型检验
灰色预测检验一般有残差检验、关联度检验和后验差检验。
(1)残差检验
按预测模型计算
并将
累减生成
然后计算原始序列

的绝对误差序列及相
对误差序列。
(4)灰色预测模型
(2)关联度检验
根据前面所述关联度的计算方法算出 与原始序列
的关联系数,然后计算出关联度。根据经验,当ρ=,。
(4)灰色预测模型
(3)后验差检验
:
b. 计算绝对误差序列的标准差:
c. 计算方差比:
(4)灰色预测模型
d. 计算小误差概率:
令:
则:
P
>
>
>

C
<
<
<


合格
勉强合格
不合格
(5)组合预测
采用不同合理的模型预测后,再进行回归得出组合预测模型。
预测模型选取的原则:
有关研究资料表明,以预测方法应用多少为标准进行从大到小排序是:回归分析、指数平滑、数量经济模型、专家会议、主观概率法、多变量时间序列模型、趋势外推、抽样调查、移动平均、投入产出、相关树、类推法等。
在高层次经济预测方面:数量经济模型、投入产出、回归分析、移动平均。
在低层次方面:专家会议、类推法、移动平均、主观概率法、回归分析、指数平滑。
(5)组合预测
预测的主导方向:定量预测、定性预测和计算机相结合。
预测科学的发展方向:神经网络预测、基于规则的预测系统、专家预测系统、判断预测、组合预测。
模型选择的原则:适用性、数据易采集性、数据时效性、定量与定性相结合。
预测的结果分析
预测的结果分析要考虑到如下的因素:
(1)相反的预测结果
(2)胜出裕度:最佳预测结果得分与相反的结果得分之间的差额占最佳预测结果的百分比。
(3)成本收益分析
趋势分析挖掘
趋势(trend)分析挖掘,该方法类似于预测分析挖掘。一个变量Y,表示某一支股票每天的收盘价,可以看作是时间t的函数,即Y=F(t),这样的函数可以用一个时间序列的图来表示。
分析时间序列数据需要注意以下4个方面:
(1)长时间的走向 T
(2)周期的走向与周期的变化 C
(3)季节性的走向与变化 S
(4)不