1 / 60
文档名称:

《描述性统计分析》.ppt

格式:ppt   大小:491KB   页数:60页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

《描述性统计分析》.ppt

上传人:相惜 2022/8/6 文件大小:491 KB

下载得到文件列表

《描述性统计分析》.ppt

相关文档

文档介绍

文档介绍:描述性统计 分析
精选ppt
主要内容
描述性统计分析
频率分析
对数据进行描述的图形化方法和数值方法
学****分析数据分布的方法
应用SPSS进行描述性数据分析的方法
常用统计图形的绘制方法和解释技巧
数据标准化
、工作年限等。
教育水平为分类变量,它有11个类别。
精选ppt
SPSS频率分析
选择【分析】→【描述统计】→【频率】
精选ppt
频率分析选项-统计量
精选ppt
频率分析选项-图表
精选ppt
频率分析的结果解释
频率表格
条形图、直方图
精选ppt
当堂练****频率分析实例
。试分析该50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。
精选ppt
中心趋势的描述
均值(尺度数据和定序数据)
中位数(尺度数据和定序数据)
众数(定性数据和尺度数据)
5%截尾均值(尺度数据和定序数据)
精选ppt
均值
均值即数据的算术平均数,是数据中心趋势的主要度量指标,
设变量有n个测量值 ,则算术均值为:
精选ppt
均值的特点
最常用的中心位置度量
受极端值影响
例:1,3,5,7,9 和
1,3,5,7,14
精选ppt
中位数
重要的中心位置度量
在递增排序后的数据列中
若数据个数为奇数,中位数是正中央的数
若数据个数是偶数,中位数是正中央的两数的平均值.
不受极端值的影,例如:1,5,7,3,9
精选ppt
众数
发生频数最高的数据值
不受极端值的影响
众数可能不存在
可能有多个众数(单峰,双峰,多峰)
可用于定量或定性数据
精选ppt
5%截尾均值
避免了极端值的影响
精选ppt
离散趋势的描述
仅仅根据数据的中心趋势指标进行决策是不够的。例如,如果一个国家的不同家庭收入差距很少;而另一个国家的家庭收入差距很大,既存在大量的贫困家庭,也存在许多十分富有的家庭,那么即使这两个国家的中等收入家庭的收入完全一样,其家庭收入情况仍然完全不同。
精选ppt
例子
假设我们有以下的三组观测值:
观测A:11,12,13,16,16,17,18,21
观测B:14,15,15,15,16,16,16,17
观测C:11,11,11,12,19,20,20,20
,那么这三组数据是否相似呢?
精选ppt
离散趋势
精选ppt
离散趋势的描述
极差(range)
方差(Variance)
标准差(.)
分位数( Percentage)
变异指标
精选ppt
极差
极差=最大值-最小值
受极端值影响较大
精选ppt
方差和标准差
方差
标准差
精选ppt
变异系数
在比较两组数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。
需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为:
精选ppt
分位数
第p百分位数
使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值
如何计算?
将原数据从小到大排列
计算i=(p/100)n
若i是整数, 则第p百分位数为第i 与第 i+1 项的平均
若i不是整数,则向上取整。
精选ppt
总结五数
最小值、第一个四分位数、中位数、第三个四分位数、最大值
从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现
精选ppt
分布的形状
偏度
当偏度系数大于0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左
当偏度系数小于0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右
当偏度系数为0,分布对称
精选ppt
峰度
峰度
>3,分布为高峰度,即比正态分布的峰要陡峭; <3,分布为低峰度,即比正态分布的峰要平坦些;=0,分布为正态峰。
精选ppt
SPSS描述性统计
许多菜单均可进行描述性分析,提供描述性统计指标的输出。例如T检验、方差分析、因子分析等
SPSS自定义表模块也可以产生大部分的描述性统计指标
精选ppt
SPSS中的菜单
专门的描述性统计菜单:
频率(F):该过程将产生频数表,输出频数分布的条形图、饼图或者直方图;
描述(D):该过程则进行一般性的统计描述;
探索(E): 该过程用于对数据概况不清时的探索性分析;
交叉表(C):该过程完成分类数据的统计描述和