文档介绍:该【SPSS中异常值检验的几种方法介绍 】是由【知识徜徉土豆】上传分享,文档一共【30】页,该文档可以免费在线阅读,需要了解更多关于【SPSS中异常值检验的几种方法介绍 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
SPSS中异常值检验的几种方法介绍
方法具体如下所示:
离群值(箱图/探索)。值与框的上下边界的距离在1。5倍框的长度到3倍框的长度之间的个案。框的长度是内距.
极端值(箱图)。
在回归模型诊断里面,一般称预测值与实际值的偏差为"残差",残差有几种表示方法:标准化残差, 学生化残差等等,按照需要取一种残差,再按照某种标准取一个阀值来限定异常点,只要那个点的残差大于阀值,就可以认为它是异常点。
SPSS14之后新功能 
SPSS Data Validation能帮助您轻松地探察多个异常值,以便您可以进一步检验并确定是否把这些观测包括在您的分析中。SPSS Data Validation异常探察程序能够基于与数据集中相似观测的偏离探察异常值,并给出偏离的原因。它使您可以通过创建新变量来标识异常值。
标签: 市场研究  研究方法  经营分析  分类: 经营分析 2009-11—24 18:59
    这段时间太忙了,一直没有静下心来。积攒了几个朋友的问题,现在来回答或介绍一些,今天先谈谈时间序列(Time—Series Forecasting)的预测问题!
预测:是对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究,简单地说就是指从已知事件测定未知事件.
为什么要预测呢,因为预测可以帮助了解事物发展的未来状况后,人们可以在目前为它的到来做好准备,通过预测可以了解目前的决策所可能带来的后果,并通过对后果的分析来确定目前的决策,力争使目前的决策获得最佳的未来结果。
我们进行预测的总的原则是:认识事物的发展变化规律,利用规律的必然性,是进行科学预测所应遵循的总的原则。
这个总原则实际上就是事物发展的
1—“惯性”原则—-事物变化发展的延续性;
2—“类推”原则-—事物发展的类似性;
3—“相关”原则-—事物的变化发展是相互联系的;
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
4—“概率"原则——事物发展的推断预测结果能以较大概率出现,则结果成立、可用;
时间序列预测主要包括三种基本方法:
1—内生时间序列预测技术;2—外生时间序列预测技术;3—主观时间序列预测技术;
当然今天我们主要讨论内生时间序列预测技术——也就是只关注时间序列的下的预测问题!
从数据分析的角度来考虑,我们需要研究:
序列是否在固定水平上下变动?
此水平是否也在变动?
是否有某种上升或下降的趋势呢?
是否存在有季节性的模式?
是否季节性的模式也在变更呢?
是否存在周期性规律和模式?
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
时间序列有一明显的特性就是记忆性(memory),记忆性系指时间数列中的任一观测值的表现皆受到过去观测值影响。
时间序列主要考虑的因素是:
长期趋势(Long-term trend) 
时间序列可能相当稳定或随时间呈现某种趋势。
时间序列趋势一般为线性的(linear),二次方程式的 (quadratic)或指数函数(exponential function)。
季节性变动(Seasonal variation)
按时间变动,呈现重复性行为的序列.
季节性变动通常和日期或气候有关.
季节性变动通常和年周期有关。
周期性变动(Cyclical variation)
相对于季节性变动,时间序列可能经历“周期性变动"。
周期性变动通常是因为经济变动。
随机影响(Random effects)
预测技术主要包括两大类:
指数平滑方法(Exponential smoothing models):
    描述时间序列数据的变化规律和行为,:您可能发现在过去的一年里,三月和九月都会出现销售的高峰,您可能希望继续保持这样,尽管您不知道为什么。
ARIMA模型:
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
    描述时间序列数据的变化规律和行为,它允许模型中包含趋势变动、季节变动、,可以把握过去数据变动模式,有助于解释预测变动规律,回答为什么这样
标签: 市场研究  研究方法  经营分析  分类: 经营分析 2009-12—02 15:35
    本想早点完成这个时间序列的主题,但最近一直非常多的事情,又耽搁了这么长时间。朋友们问的问题没有收尾总是不好,抓紧时间完成吧。
    因为,后天要参加中国电信集团的一个EDA论坛,要仔细准备发言稿!在交流的过程中,发现大家都对预测问题非常关注,尤其是数据挖掘领域,有时候分类问题与预测问题在表达上区分不开,有时候分类就是预测,比如通过判别分析、,得到的结论说该客户是什么类别等级,似乎也可以说是预测;当然,如果能够预测该消费者什么时候流失,也就是进行了分类;这样说吧,其实有时候并不需要严格区分分类和预测,关键是时间点。从这也可以看出,预测问题内涵和外延是非常宽泛的,但研究者心中要有数,这决定了你得到的结果该如何应用。
    前面的博文提到,如果我们考虑时间序列预测包含有预测和干扰变量如何解决的问题。
    从方法角度讲,过去没有统计分析软件要完成预测可以说是困难的,现在有了软件工具就方便多了。
    从技术角度讲:
预测模型如果能够排除因为异常原因造成的时间点事件和时间段时间,就好了。例如某天停电没有开业,或者某一段时间比如发生甲型H1NI一周没有营业收入,这些事件必须能够告诉模型未来不会再发生了;
当然,我们也要把未来会重复发生的干扰因素纳入模型,例如:我们学校某天要开运动会,小卖部的可乐销量一定提高,或者我们学校7—8月份放暑假,销量一定减少,像这样的时间点和时间段事件未来会重复出现,我们如果能够告诉模型,那么预测会更准确.
当然如果我们建立的模型能够预测未来,并能够将未来可预见的事件,包括时间点和时间段干扰纳入预测是非常好的事情啦!
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
甚至,我们应该能够把预测模型中的,预测未来周期内的不可预见的时间点和时间段随时干预预测结果,这就需要考虑如何将预测模型导入生产经营分析系统了.
下面的数据延续前两篇的案例,只是增加了自变量,(因为手头这个案例没有干预因素变量)
在我们增加了5个自变量后,采用预测建模方法,选择专家建模器,但限制只在ARIMA模型中选择。
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
确定后,得到分析结果,我们现在来看一下与原来的模型有什么不同。
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
    从预测值看,比前一模型有了改进,至少这时候的模型捕捉了历史数据中的下降峰值,这可以认为是当前比较适合的拟合值了。
    如果我们观察预测结果,可以发现模型选择了两个预测变量。注意:使用专家建模器时,只有在自变量与因变量之间具有统计显著性关系时才会包括自变量。如果选择ARIMA模型,“变量”选项卡上指定的所有自变量(预测变量)都包括在该模型中,这点与使用专家建模器相反;
    当确定了最终选择的预测模型和方法后,我们就可以预测未来了,当然你要指定预测未来的时间点,这里我们时间包括年、季度和月份;假定我们预测未来半年的销售收入。
我们分别设定:预测值输出,95%置信度的上下限。注意:SPSS中文环境有个小Bug,必须改一下名字!
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
    在选项中,选择你的预测时间,预测期将根据你事先定义的数据时间格式填写。(后面的模型为了让大家看清楚,实际上我预测了一年的数据,也就是2010年的4个季度的12个月)。
    自变量的选择问题,在预测未来半年的销售收入中,ARIMA模型可以把其它预测变量纳入考虑,但如何确定未来这些预测变量的值呢?
    主要方法可以考虑:1)选择最末期数据;2)选择近三期数据的平均;3)选择近三期的移动平均
这里我们选近三期移动平均作为预测自变量数值。
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
(完整word版)SPSS中异常值检验的几种方法介绍
上面就是预测结果!于此同时,SPSS活动数据集中也存储了预测值!
    最后,我们要解决时间序列预测的检验和统计问题!说实在话,我比较关注偏好商业应用,就是看得见就做得到!从上面的分析,我们基本上就知道了哪种预测模型更好,也就不去较真只有专业统计学者才关心的统计和检验问题,把这些交给统计专家或学术研究吧!(如果你是写学术论文,就必须强调这一点了!)
    实际上我们可以通过软件得到各种统计检验指标和统计检验图表!