文档介绍:该【SAS学习系列39.时间序列分析Ⅲ—ARIMA模型 】是由【海洋里徜徉知识】上传分享,文档一共【38】页,该文档可以免费在线阅读,需要了解更多关于【SAS学习系列39.时间序列分析Ⅲ—ARIMA模型 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
39。 时间序列分析Ⅱ——ARIMA模型
随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。。而Gramer分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息.
(一)ARMA模型
即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR模型、MA模型和ARMA模型.
一、AR(p)模型——p阶自回归模型
1. 模型:
其中,,随机干扰序列εt为0均值、方差的白噪声序列(, t≠s),且当期的干扰与过去的序列值无关,即E(xtεt)=0。
由于是平稳序列,可推得均值。 若,称为中心化的AR(p)模型,对于非中心化的平稳时间序列,可以令,转化为中心化。
记B为延迟算子,称为p阶自回归多项式,则AR(p)
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
模型可表示为:.
2. 格林函数
用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),Gj表示扰动εt-j对系统现在行为影响的权数。
例如,AR(1)模型(一阶非齐次差分方程),
模型解为.
3。 模型的方差
对于AR(1)模型,。
4. 模型的自协方差
对中心化的平稳模型,可推得自协方差函数的递推公式:
用格林函数显示表示:
对于AR(1)模型,
5。 模型的自相关函数
递推公式:
对于AR(1)模型,.
平稳AR(p)模型的自相关函数有两个显著的性质:
(1)拖尾性
指自相关函数ρ(k)始终有非零取值,不会在k大于某个常数之后就恒等于零;
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(2)负指数衰减
随着时间的推移,自相关函数ρ(k)会迅速衰减,且以负指数(其中为自相关函数差分方程的特征根)的速度在减小。
6. 模型的偏自相关函数
自相关函数ρ(k)实际上并不只是xt与xt—k之间的相关关系,它还会受到中间k-1个随机变量xt-1, …, xt—k+1的影响。为了能剔除了中间k—1个随机变量的干扰,单纯测度xt与xt-k之间的相关关系,引入了滞后k偏自相关函数(PACF),计算公式为:
其中,
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
滞后k偏自相关函数实际上等于k阶自回归模型第k个回归系数:
两边同乘以xt—k,求期望再除以得到
取前k个方程构成的方程组:
称为Yule-Walker方程,可以解出.
可以证明平稳AR(p)模型,当k〉p时,. 即平稳AR(p)模型的偏自相关函数具有p步截尾性。
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
注:实际上样本的随机性使得偏自相关函数不是严格截尾,例如上面两图都1阶显著不为0,1阶之后都近似为0.
二、MA(q)模型——q阶移动平均模型
1. 模型:
其中,,随机干扰序列为0均值、方差的白噪声序列(, t≠s)。
若μ=0,称为中心化的MA(q)模型,非中心化的MA(q)模型可以通过转化为中心化。
记B为延迟算子,称为q阶自移动平均系数多项式,则中心化MA(q)模型可以表示为。
2. 模型的方差
3。 模型的自协方差
只与滞后阶数k相关,且q阶截尾。当k=0时,
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
当1≤k≤q时,
当k〉q时,.
4。 模型的自相关函数:(q阶截尾性)
5。 模型的滞后k阶偏自相关函数(中心化)
可以证明滞后k阶偏自相关函数具有拖尾性。
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
6。 模型的可逆性
以MR(1)为例,
模型Ⅰ:
模型Ⅱ:
它们的自相关函数相同(即相同的自相关函数对应不同的回归模型),为了保证对应的唯一性,需要增加约束条件,即MR(q)模型的可逆性条件。
观察两个模型的第二种表示:当时,模型Ⅰ收敛、模型Ⅱ不收敛;当时,模型Ⅰ不收敛、模型Ⅱ收敛.
表示成收敛形式的MR(q)模型称为可逆MR(q)模型。一个自相关函数只对应唯一一个可逆MR(q)模型。
三、ARMA(p, q)模型——自回归移动平均模型
1。 模型
其中,,,随机干扰序列εt为0均值、方差的白噪声序列(, t
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
≠s),且当期的干扰与过去的序列值无关,即E(xtεt)=0.
若,则称为中心化的ARMA(p,q),中心化的ARMA(p,q)模型可表示为:.
显然,AR(p)和MA(q)模型是ARMA(p,q)模型的特例。
2. 数字特征
(1)均值:;
(2)自协方差函数:,其中Gi为格林函数;
(3)自相关函数:
3. 模型的初步定阶
对于平稳非白噪声序列,计算出样本自相关系数(ACF)和偏自相关系数(PACF),根据其性质估计自相关阶数和移动平均阶数,称为ARMA(p,q)模型的定阶。
可以推导出:样本自相关函数和偏自相关函数都近似服从正态分布。
取显著水平α=0。05,若样本自相关系数和样本偏自相关系数在最初的k阶明显大于2倍标准差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k阶截尾;若有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
4. 参数估计
对非中心化的ARMA(p,q)模型
.
参数μ可用样本均值来估计总体均值(矩估计法),初步定阶估计出自相关阶数和移动平均阶数后,模型共有p+q+1个未知参数:.
(1)参数的矩估计
用时间序列样本数据计算出延迟1阶到p+q阶的样本自相关函数,延迟k阶的总体自相关函数为。 用计算出的样本自相关函数来估计总体自相函数,得到p+q个联立方程组:
从中解出的值作为未知参数估计值。 ARMA(p,q)模型的两边同时求方差,并把前面的参数的估计值代入,可得白噪声序列的方差估计为:
(2)参数的极大似然估计
当总体分布类型已知时,极大似然估计是常用的估计方法。其基本思想是,认为样本来自使该样本出现概率最大的总体。
因此,未知参数的极大似然估计,就是使得似然函数(即联合密度函数)达到最大值的参数值
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
(完整word版)Ⅲ—ARIMA模型
:
在时间序列分析中,序列的总体分布通常是未知的。为了便于分析和计算,通常假设序列服从多元正态分布,它的联合密度函数是可导的。在求极大似然估计时,为了求导方便,常对似然函数取对数,然后对对数似然函数中的未知参数求偏导数,,只要求解似然方程组即可得到未知参数的极大似然估计。但在实际上是使用计算机经过复杂的迭代算法求出未知参数的极大似然估计.
两种估计的比较:
矩估计的优点是不要求知道总体的分布,计算量小,估计思想简单直观。但缺点是只用到了样本自相关系数的信息,序列中的其他信息被忽略了,这导致估计精度一般较差。因此,它常被作为极大似然估计和最小二乘估计的迭代计算的初始值.
极大似然估计的优点是充分应用了每一个观察值所提供的信息,因而它的估计精度高,同时,还具有估计的一致性、渐近正态性和渐近有效性等优良统计性质,是一种非常优良的参数估计方法。
(3)参数的最小二乘估计
使ARMA(p,q)模型的残差平方和达到最小的那组参数值:
通过计算机借助迭代方法求出。由于充分利用了序列的信息,该方法估计精度最高.
在实际运用中,最常用的是条件最小二乘估计,假定时间序列过去未观察到序列值等于序列均值,可得到残差的有限项表达式:
于是残差平方和达到最小的那组参数值为: