文档介绍:用样本的数字特征估计总体的数字特征
标准差
平均数向我们提供了样本数据的重要信息,,,只有平均数还难以概括样本数据的实际状态.
如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于
?
4
5
6
7
8
9
10
环数
频率
(甲)
4
5
6
7
8
9
10
环数
频率
(乙)
直观上看,:甲成绩比较分散,乙成绩相对集中(如图示).因此,:在作统计图,表时提到过的极差.
甲的环数极差=10-4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
考察样本数据的分散程度的大小,最常用的统计量是标准差.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是, 表示这组数据的平均数,则到的距离是:
于是样本数据到的平均距离是:
由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.
考虑一个容量为2的样本:
,其样本的标准差为
显然,标准差越大,则s 越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
s
例题1:画出下列四组样本数据的直方图,说明它们的异同点.
(1) 5, 5, 5, 5, 5, 5, 5, 5, 5;
(2) 4, 4, 4, 5 , 5, 5, 6, 6, 6;
(3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7;
(4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ;
解:四组样本数据的直方图是:
1
2
3
4
5
6
7
8
频率
o
S=
(2)
频率
o
1
2
3
4
5
6
7
8
S=
频率
o
1
2
3
4
5
6
7
8
S=
频率
o
1
2
3
4
5
6
7
8
S=
(1)
(3)
(4)
,,,
,。虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.
例2 、,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)
甲 , , , ,
, , , ,
, , , ,
, , , ,
乙 , , , ,
, , , ,
, , , ,
, , , ,
从生产的零件内径的尺寸看,谁生产的质量较高?