1 / 5
文档名称:

SPSS异常值剔除.doc

格式:doc   大小:222KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SPSS异常值剔除.doc

上传人:qiang19840906 2020/9/1 文件大小:222 KB

下载得到文件列表

SPSS异常值剔除.doc

文档介绍

文档介绍:离群值(箱图/探索).。框的长度是内距。极端值(箱图).值距离框的上下边界超过3倍框的长度的个案。在回归模型诊断里面,一般称预测值与实际值的偏差为"残差",残差有几种表示方法:标准化残差,学生化残差等等,按照需要取一种残差,再按照某种标准取一个阀值来限定异常点,只要那个点的残差大于阀值,就可以认为它是异常点。data下拉菜单里有definevariableproperties,把变量选到右边的框里,点continue,在新窗口中有变量在样本中的所有取值,要定义某个值是异常值,就把相应的missing框勾上就ok啦~~~然后再处理数据时这些值就已经被剔除,不参与分析了一、采用数据探索过程探测异常值 SPSS菜单实现程序为:主菜单-->“Analyze”-->“DescriptiveStatistics”-->“Explore……”选项-->“Statistics”按钮-->选中“Outliers”复选框。输出结果中将列出5个最大值和5个最小值作为异常的嫌疑值。一般数组应遵循正态分布,但一列数组中有可能会出现异常值,从而影响数据的方差和统计结果,因此挡在SPSS中输入数据后,首先要检查数据中是否存在异常值。方法如下:选择想要观察的数据,此处我们选择normal列中的数据进行查看进入菜单栏中“分析”→“描述统计”→“探索”将“normal”数组放入因变量列表中点击“探索”窗口中的“统计量”,点掉“描述性”,选择“界外值”和“百分位数”点击“探索”窗口中“绘制”,选择“直方图”,去掉“茎叶图”选择结束后点击“探索”窗口“确定”查看结果:百分位数图:百分位数百分位数5102550759095加权平均(定义1)%左右两个百分位数(即四分位数25和75下方的加权平均值)的加权平均值计算最高和最低临界值,使用计算公式如下:Upper=Q3+(*(Q3-Q1))Lower=Q1-(*(Q3-Q1))此处Q3=,Q1=,Upper=,Lower=-“极值”表格:。。如果有最高值查过Upper,或最低值小于Lower值,则被视为Outliers,即异常值。由图中看,此列数组并无异常值二、采用箱线图(boxplot)探测异常值箱线图比较直观、形象,易于理解,因此它在统计分析中占有非常重要的地位。 ,在“Explore”对话框中单击“Plots”,出现