文档介绍:第三章数据分布特征的描述
第三章数据分布特征的描述
数据的特征和测度
分布的形状
集中趋势
离散程度
众数
中位数
变异系数
标准差
方差
全距
位置
平均数
数值
平均数
算术平均数
几何平均数
峰度
偏态
第一节分布集中趋势的测度
1. 一组数据向其中心值靠拢的倾向和程度
2. 测度集中趋势就是寻找数据一般水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据
5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定
运用集中趋势的优点:使数据高度地简化
缺点:任何的简单化都意味着某
些信息的丢失
一. 定类数据:众数
二. 定序数据:中位数
三. 定距和定比数据:数值平均数
(一)算术平均数
(二)几何平均数
四. 众数、中位数和算术平均数的比较
一、众数(Mode)
集中趋势的测度值之一
出现次数最多的变量值
位置平均数,不受极端值的影响
可能没有众数或有几个众数
主要用于定类数据,也可用于定序数据和数值型数据
众数没有说明具体的差距,掩盖了许多信息。
无众数原始数据: 10 5 9 12 6 8
一个众数原始数据: 6 5 9 8 5 5
多于一个众数原始数据: 25 28 28 36 42 42
众数(Mode)的确定
1. 对定性资料、未分组资料和单值分组资料:
找出出现次数最多的变量值
表3-1 某城市居民关注广告类型的频数分布
广告类型
人数(人)
比例
频率(%)
商品广告
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
112
51
9
16
10
2
合计
200
1
100
【例】根据表3-1中的数据,计算众数(定类资料)
【例】根据表3-2中的数据,计算众数(定序资料)
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数(户)
百分比(%)
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
8
36
31
15
10
合计
300
1. 众数的值与相邻两组频数的分布有关
500
800
1100
1400
1700
2000
50
100
150
1040
d1
d2