文档介绍:spss统计分析-实例分析
1、基本统计分析
基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中,e):标准差的平方。
SPSS中计算的是样本方差。
极差 (range): (maximum)—(minimum)
描述分析
刻画分布形态的描述统计量
数据分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等。
常用统计量:偏度、峰度
偏度:描述变量取值分布形态对称性的统计量。
当分布为对称分布时,正负总偏差相等,偏度值等于0;当分布为不对称分布时,正负总偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,称为正偏或右偏;偏度值小于0表示负偏差值大,称为负偏或左偏。偏度绝对值越大,表示数据分布形态的偏斜程度越大。
峰度:描述变量取值分布形态陡峭程度的统计量。
当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0;峰度大于0表示数据的分布比标准正态分布更陡峭,为尖峰分布;峰度小于0表示数据的分布比标准正态分布平缓,为平峰分布。
扁平分布
尖峰分布
峰态
左偏分布
右偏分布
与标准正态分布比较!
偏态
扁平分布
尖峰分布
扁平分布
尖峰分布
左偏分布
扁平分布
尖峰分布
右偏分布
左偏分布
扁平分布
尖峰分布
描述分析
计算基本描述统计量的操作
(1)分析—描述统计—描述
(2)将分析变量选择到变量框中
(3)单击选项按钮指定基本统计量
描述分析
应用例一
案例1-3:计算人均住房面积的基本描述统计量,并对本市户口和外地户口家庭的情况进行比较。
操作步骤:
调用命令Analyze\Descriptive Statistics \Descriptives
选择“人均面积”作为分析变量
选择必要的分析指标
根据户口状况对数据进行拆分(Split File)
重新调用命令\Descriptives计算不同户口状况的指标值
应用例一分析结果
全部数据分析结果
分组数据分析结果
描述性分析
描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频数分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准正态评分值,并以变量形式存入数据文件中,以便后续分析时应用。
在多元统计分析中,对均值差异较大的变量,采用变量标准化后的数据进行分析,可以消除均值差异带来的影响。
描述统计量
例:调查记录了130名正常男性血液中的红细胞数(RBC,万/mm),用描述统计量查看该数据的统计特征。
SPSS的操作步骤
1、菜单中点分析/描述统计/描述,进入描述对话框
2、将变量算入变量窗口,进入选项对话框进行设置,完成后点继续,并确定
SPSS的输出结果
数据编辑窗口中,在原变量右侧多了一列由原变量标准化产生的“Z+原变量名”
的列
交叉分组下的频数分析
目的
了解不同变量在不同水平下的数据分布情况
例:学习成绩与性别有关联吗?(两变量)
例:职业、性别、爱逛商店有关联吗?(三变量)
分析的主要步骤
产生交叉列联表
分析列联表中变量间的关系
列联表
列联表分析过程,可通过Crosstabs对话框实现(Analyze Descriptive Statistics Crosstabs)。
公司1
公司2
公司3
公司4
合计
赞成
68
75
57
79
279
反对
32
45
33
31
141
合计
100
120
90
110
420
已知对集团公司某项改革方案意见的调查结果,试分析各子公司对该项改革方案的态度是否一致.
定义变量(形成数据集3)
公司 company
公司1 1
公司2 2
公司3 3
公司4 4
68
32
75
45
57
33
79
31
态度 attitude
赞成 1
反对 2
赞成 1
反对 2
赞成 1
反对 2
赞成 1
反对 2
观察频数 freq
指定freq为加权变量
Crosstabs对话框
指定行变量
指定列变量
指定分布表的层变量
显示分类条形图
不输出多维交叉表
Crosstabs对话框
本例中选择chi-square
卡方检验
分类