文档介绍:第4章数据分布特征的测度 对统计数据分布的特征可以从三个方面进行测度和描述:集中趋势、离散程度、偏态和峰度。
重点:掌握各类统计指标的计算方法和应用原则,并进行初步的分析。
难点:结合实例准确进行集中趋势和离散程度的测度及分析。
第1节集中趋势的量度
集中趋势(Central tendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
分类数据:众数
顺序数据:中位数和分位数
数值型数据:均值
集中趋势(Central tendency)
一组数据向其中心值靠拢的倾向和程度
测度集中趋势就是寻找数据水平的代表值或中心值
不同类型的数据用不同的集中趋势测度值
低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据
均值(mean)
集中趋势的最常用测度值
一组数据的均衡点所在
体现了数据的必然性特征
易受极端值的影响
用于数值型数据,不能用于分类数据和顺序数据
一、算术平均数(Arithmetic mean)(一)简单算术平均数
例:有5名工人生产的零件数分别为:15、16、17、18、19,平均零件数为多少?
解: (件)
(二)加权算术平均数
基本公式
影响加权算术平均数的因素:变量值和权数
选择权数的原则:变量值与其乘积是具有实际经济意义的标志总量。
加权算术平均数与简单算术平均数的关系:
当时,
例:计算某车间工人平均工资(单项式) 某班组工人平均工资的计算(单项式数列)
解: (元)
工资(x)
工人数(f)
工资总额(xf)
500
2
1000
530
4
2120
740
8
5920
860
5
4300
1020
1
1020
合计
20
14360
按零件数分组(个)
组中值
(x)
人数(f)
xf
50—60
55
8
440
60—70
65
20
1300
70—80
75
12
900
合计
—
40
2640
例:计算某车间工人加工零件平均数(组距式数列)
解: (件)
权数对均值的影响
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组: 考试成绩(x ): 0 20 100
人数分布(f ):1 1 8
乙组: 考试成绩(x): 0 20 100
人数分布(f ):8 1 1
均值的数学性质
1. 各变量值与均值的离差之和等于零
2. 各变量值与均值的离差平方和最小