文档介绍:当得到集中量数之后,我们就可以知道整组数据的平均结果,可以知道每一个数据和其它数据的比较结果。但是我们还无法了解数据相互之间的差别到底是大还是小,也就是不知道这些数据的分布或离散的程度。因此我们还需要描述数据离中趋势的统计量数。
第九章离中趋势的度量
第一节差异量数
第二节方差和标准差
第一节其它差异量数
一、全距
全距(range):一组数列中最大和最小数值之间的差。
R=XH-XL
其中XH为最大数值, XL为最小数值。
二、平均差
平均差(mean deviation,MD):各个数据与平均数差数的绝对值的平均数,称为平均差。
MD=|X-Xm|/n
平均差使用绝对值,没有正负,所以不便于在统计中运用。
第二节方差和标准差
一、方差和标准差
1、方差
方差(variance, 2, S2 ):各数据与平均数差数的平方和的平均值称为方差,也称为变异数。
因此,方差的定义公式为:
2= (X-)2/n
S2= (X-Xm)2/n
2、标准差
计算方差时使用了平方,也就是夸大了数据和平均数的距离,因此需要将方差开方以还原其本来的差异,这就是标准差。即:标准差(standard deviation,,S)是方差的平方根。标准差的定义公式:
=√2=√(X-)2/n
S=√ S2=√(X-Xm)2/n
3、方差的估计值
总体的参数可以用样本的统计量来加以估计,但是用一个样本的统计量来估计它所属总体的参数,可能容易发生错误。但是,如果我们用一个包含有无限多个元素的样本的统计量来估计总体的参数就不容易造成错误,这个统计量就被称为是总体参数的无偏估计值(unbiased estimate)。
如果从总体中随机抽取一个样本,样本包含有无限多个个体,则计算样本平均数的公式为:
Xm= X/n
这就是总体平均数的无偏估计值。这样我们就可以将下列公式中的用Xm替代,作为样本估计总体方差的无偏估计值。
2= (X-)2/n
2=S2= (X-Xm)2/n
但是,统计学家发现用这样的公式求出来的方差低估了总体的变异,因此使用(X-Xm)2/n来估计总体的方差时,分母的n必须改为(n-1)才不会低估总体的方差,这里(n-1)就叫做样本的自由度。