1 / 17
文档名称:

SPSS学习系列09缺失值处理.docx

格式:docx   大小:461KB   页数:17页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SPSS学习系列09缺失值处理.docx

上传人:63229029 2017/4/14 文件大小:461 KB

下载得到文件列表

SPSS学习系列09缺失值处理.docx

文档介绍

文档介绍:09. 缺失值处理空缺值(用“.”表示)和输入错误值,都属于缺失值范畴。输入错误值需要做“数据检验”来发现: (1) 【分析】——【描述统计】——【描述】和【频率】(2) 【图形】——【旧对话框】——【箱图】观察极小、极大值、频率、异常值等来判断。例如,性别“男=1,女=2”,若极大值出现 3 ,则是输入错误值;箱线图或 3 σ原则发现的异常值, 则要先改成缺失值。缺失值的处理方法通常有四种。一、删除有缺失值的个案删除有缺失值的个案, 或在具体统计分析时的【选项】——【缺失值】框选择某种处理方法: ①按列表排除个案——只要任何一个变量含有缺失值, 就要剔除出所有因变量或分组变量中有缺失值的观测记录; ②按对排除个案——同时剔除带缺失值的观测量及与缺失值有成对关系的观测量(对照分析); ③使用均值替换——使用该变量的均值替换缺失值。二、替换缺失值 SPSS 提供了 5 种简单替换缺失值的方法: (1 )序列均值——该变量的有效观察值的平均数; (2 )临近点的均值——该缺失值前后 n 个观察值的平均数; (3 )临近点的中位数——该缺失值前后 n 个观察值的中位数; (4 )线性插值——该缺失值前后观察值建立插值直线确定【同取 n=1 的( 2)】; (5) 点处的线性趋势——以编号为自变量用线性回归法预测值。现有数据文件: 1. 【转换】——【替换缺失值】,打开“替换缺失值”窗口,将变量“统计成绩”选入【新变量】框; 2. 【名称和方法】框,设定新变量名称“统计成绩_1”,方法选“序列均值” 3. 点【确定】,得到注意: 若某个案的缺失值较多最好删除该个案, 而不是替换其缺失值。三、缺失值分析 SPSS 中更高级的处理缺失值的方法是缺失值分析,它能够(1 )缺失值的描述和快速诊断: 用灵活的诊断报告来评估缺失值问题的严重性, 用户可以观察到它们在哪些变量中出现,比例是多少,是否与其它变量取值有关,从而得知这些缺失值出现是否会影响分析结论。(2 )得到更精确的统计量: 提供了多种方法用于估计含缺失值数据的均值、相关矩阵或协方差矩阵,通过这些方法计算出的统计量更加可靠。(3 )用估计值替换缺失值: 使用 EM 或回归法, 用户可以从未缺失数据的分布情况中推算出缺失数据的估计值, 从而能有效地使用所有数据进行分析, 来提高统计结果的可信度。【缺失值分析】实例操作,使用 SPSS 20 自带的实例文件: 1. 【分析】——【缺失值分析】,打开“缺失值分析”窗口,将变量“婚姻状况、教育程度、退休、性别”选入【分类变量】,将变量“服务月数、年龄、现在住址居住年数、家庭收入、现职位工作年数、家庭人数”选入【定量变量】注意:最大类别(最大分类数)默认为 25 ,超过该数目的分类变量将不引入分析。 【描述】, 打开“描述统计”子窗口, 用来设置要显示的缺失值描述统计量。勾选“单变量统计量”,勾选【指示变量统计量】框的“使用有指示变量形成的分组进行的 t 检验”和“为分类变量和指示变量生成交叉表”,点【继续】 【模式】, 打开“模式”子窗口, 用来设置显示输出表格中的缺失数据模式和范围。勾选“按照缺失值模式分组的表格个案”; 因为“教育程度”、“退休”和“性别”中的缺失模式似乎影响数据,“家庭收入”含有大量缺失值,将这些变量选入【附加信息】; 其它保持默认,点【继续】 4. 回到原窗口, 勾选【估计】框中的“ EM ”和“回归”, 其它默认设置。点击【 EM 】或【回归】按钮可以修改其设置注意: 若要保存替换缺失值之后的数据, 需要勾选“保存完成数据”:创建新数据集并命名,或写入新数据文件。另外, 默认使用所有变量进行分析, 若要选择部分变量, 可点【变量】按钮修改。点【确定】,得到输出结果: 单变量统计 N 均值标准差缺失极值数目计数百分比低高 tenure 968 32 00 age 975 25 00 address 850 150 09 e 821 179 0 71 employ 904 96 0 15 reside 966 34 0 33 marital 885 115 ed 965 35 retire 916 84 gender 958 42 a. 超出范围( Q1- *IQR , Q3+ *IQR )的案例数。提供了数据的一般特征,给出了所有分析变量缺失数据的频数、百分比,定量变量的均值、标准差、极值数目。 e ( 家庭收入) 有最多

最近更新

福建省莆田市事业单位招聘考试(职业能力倾向.. 147页

贵州遵义农科院2024事业单位招聘研究生1名历年.. 60页

辽宁省葫芦岛市事业单位招聘考试(职业能力倾.. 147页

重庆巴南区2024年二季度公开招聘事业单位工作.. 58页

黑龙江省绥化市事业单位招聘考试(职业能力倾.. 149页

Windows系统加固实验09-Windows操作系统安全 34页

全国大学生数学建模竞赛C题国家奖一等奖优秀论.. 14页

增压器效率 6页

教室学生用课桌椅分析与设计说明 27页

水产养殖专业综合实习报告模板 28页

碰撞实验报告 12页

读书报告会主题 9页

广场推广宣传方案 31页

立春心情短句大全25条 8页

快乐的周末作文9篇 9页

财务共享服务中心智能化探索 10页

2024安徽省合肥市公务员考试言语理解与表达专.. 119页

2024山东高速集团限公司校园招聘1584人高频考.. 148页

2024年中华联合保险集团股份有限公司校园招聘.. 148页

2024年保育员中级工理论经典题库参考答案 23页

大连地铁规划方案 32页

2024年圆通速递股份有限公司校园招聘考试试题.. 149页

2024年山东公务员行测言语理解与表达题目学生.. 117页

2024年山东菏泽投资发展集团限公司招聘61人高.. 147页

2024年广东省深圳市坪山区事业单位招聘26人历.. 90页

2024年广东省深圳市福田区事业单位招聘48人历.. 88页

2024年广东省潮州市住房和城乡建设局招聘9人历.. 88页

2024年广东省珠海市市委办公室招聘7人历年高频.. 89页

预防患者自杀应急预案ppt课件 27页

服装招商联营策划方案 28页