文档介绍:第三章统计资料的综合
第三章统计资料的综合
第二章主要介绍了统计资料的整理,得到分布表和统计图等。这当然
已能使我们对一份统计资料(数据)有概括地了解。但为了更进一步综合地
说明统计资料的特征,以及为了与类似问题进行比较等,有必要用一些数值
将资料的特征表示出来,这样的数值称为特征数。我们在本章只考虑单变量
的问题,将介绍三类特征数:表示集中位置的特征数,表示变异(分散)程
度的特征数和表示偏倚程度的特征数。
表示集中位置的特征数
平均数
1、算术平均数(Arithmetic average)
(1)定义
一组 n 个观测值 x1,x2 ,…,xn 的算术平均数,定义为 x
n
x
∑ i (3-1)
x = i=1
n
如果资料已经分组,组数为 k,用 x1,x2 , …,xk 表示各组中点,f1,f2…,fk
表示相应的频数,那么
k
∑ fiix
i=1
x = k (3-2)
∑ fi
i=1
当然,各组中数值都用中点值代替了,所得结果只能是近似的。因此,
在求算术平均数时应尽可能用分组前的原始数据。
[例 ]某学院一年级学生有 200 人,二年级学生 150 人,三年级学生
100 人,四年级学生有 200 人。某日学院召开全院大会,一年级学生缺席 4
%,二年级学生缺席 6%,三年级学生缺席 5%,四年级学生缺席 8%,试
问全院学生缺席百分之几?
-27 -
第三章统计资料的综合
表 3-1 某学院学生缺席状况表
X f
4 200
6 150
5 100
8 200
k
∑ f i xi
i = 1
x =
k
∑ f i
i = 1
4× 200 + 6×150 + 8× 200 + 5×100
x =
200 +150 +100 + 200
3800
= =
650
∴该日全院学生缺席 %
[例 ]
表 3-2 某校 125 位大学一年级新生体重表
体重(公斤) 组中值(x) 人数(f)
46—48 47 4
49—51 50 20
52—54 53 25
55—57 56 38
58—60 59 21
61—63 62 12
64—66 65 5
k
∑ f i xi
平均体重: x = i = 1
k
∑ f i
i = 1
6949
= =
125
- 28 -
第三章统计资料的综合
(2)性质
n ⎛_⎞
①∑⎜−⎟= 0
⎜ xi x ⎟
i = 1⎝⎠
n 2
②∑()xi − A 当 A = x 时最小
i = 1
n n
Q 2 2
∑()xi − A = ∑[]()xi − x + ()x − A
i = 1 i = 1
n 2 2 n
= ∑()xi − x + n()x − A + 2 ∑()xi − x ()x − A
i = 1 i = 1
n 2 2 n
= ∑()xi − x + n()x − A + 2()x − A ∑()xi − x
i = 1 i = 1
n 2
2
= ∑()xi − x + n()x − A
i=1
n
2
∴当 x − A = 0 时, ∑()xi − A 为最小
i=1
2、几何平均数(Geometric Mean)
在数据为环比类型的问题中,算术平均数是不适用的。例如表3-3 是天
津市工农业总产值在“六五”期间的逐年增长率,如求该期间平均增长率,
算术平均数是不恰当的。几何平均数可以解决这个问题。
表 3-3 天津市工业总产值
年份比上年增长%
2000
2001
2002
2003
2004
2005
(天津市统计年鉴 2005 年)
-29 -
第三章统计资料的综合
(1) 定义
一组 n 个数据 r1,r2 ,...,rn 的几何平均数 G 定义为:
G = n r r ... r (3-3)
1 2 n
在上例中,令 r1,r2 ,...,r5 依次为 ,,,,
于是几何平均数
5 ×