1 / 29
文档名称:

2021年离中趋势的度量.ppt

格式:ppt   大小:161KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

2021年离中趋势的度量.ppt

上传人:业精于勤 2021/1/16 文件大小:161 KB

下载得到文件列表

2021年离中趋势的度量.ppt

相关文档

文档介绍

文档介绍:第一节 其它差异量数
一、全距
全距(range):一组数列中最大和最小数值之间的差。
R=XH-XL
其中XH为最大数值, XL为最小数值。
*
离中趋势的度量
*
二、平均差
平均差(mean deviation,MD):各个数据与平均数差数的绝对值的平均数,称为平均差。
MD=|X-Xm|/n
平均差使用绝对值,没有正负,所以不便于在统计中运用。
*
离中趋势的度量
*
第二节 方差和标准差
一、方差和标准差
1、方差
方差(variance, 2, S2 ):各数据与平均数差数的平方和的平均值称为方差,也称为变异数。
因此,方差的定义公式为:
2= (X-)2/n
S2= (X-Xm)2/n
*
离中趋势的度量
*
2、标准差
计算方差时使用了平方,也就是夸大了数据和平均数的距离,因此需要将方差开方以还原其本来的差异,这就是标准差。即:标准差(standard deviation,,S)是方差的平方根。标准差的定义公式:
=√ 2=√(X-)2/n
S=√ S2=√(X-Xm)2/n
*
离中趋势的度量
*
3、方差的估计值
总体的参数可以用样本的统计量来加以估计,但是用一个样本的统计量来估计它所属总体的参数,可能容易发生错误。但是,如果我们用一个包含有无限多个元素的样本的统计量来估计总体的参数就不容易造成错误,这个统计量就被称为是总体参数的无偏估计值(unbiased estimate)。
*
离中趋势的度量
*
如果从总体中随机抽取一个样本,样本包含有无限多个个体,则计算样本平均数的公式为:
Xm=  X/n
这就是总体平均数的无偏估计值。这样我们就可以将下列公式中的用Xm替代,作为样本估计总体方差的无偏估计值。
2= (X-)2/n
2=S2= (X-Xm)2/n
*
离中趋势的度量
*
但是,统计学家发现用这样的公式求出来的方差低估了总体的变异,因此使用(X-Xm)2/n来估计总体的方差时,分母的n必须改为(n-1)才不会低估总体的方差,这里(n-1)就叫做样本的自由度。
*
离中趋势的度量
*
(1)自由度
自由度(degree of freedom, df)是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。
例如,在估计总体的平均数时,样本中的n个数全部加起来,其中任何一个数都和其他数据相独立,从其中抽出任何一个数都不影响其他数据(这也是随机抽样所要求的)。因此一组数据中每一个数据都是独立的,所以自由度就是估计总体参数时独立数据的数目,而平均数是根据n个独立数据来估计的,因此自由度为n。
*
离中趋势的度量
*
但是为什么用样本估计总体的方差时,方差的自由度就是(n-1)?
2= (X-)2/n
从此公式我们可以看出总体的方差是由各数据与总体平均数的差值求出来的,因此必须将固定后才可以求总体的方差。因此,由于被固定,它就不能独立自由变化,也就是方差受到总体平均数的限制,少了一个自由变化的机会,因此要从n里减掉一个。
*
离中趋势的度量
*
那为什么平均数被固定后会限制数据的自由变化?
假设一个样本有两个数值,X1=10,X2=20,我们现在要用这个样本估计总体的方差,则样本的平均数是:
Xm= X/n=(10+20)/2=15
现在假设我们已知Xm=15,X1=10,根据公式Xm= X/n,则有:
X2=2Xm-X1=2×15-10=20
由此我们可以知道在有两个数据样本中,当平均数的值和其中一个数据的值已知时,另一个数据的值就不能自由变化了,因此这个样本的自由度就减少一个,变成了(n-1)。依此类推:在一组数据中,当其平均数和前面的数据都已知时,最后一个数据就被固定而不能独立变化了,因此这个样本能够独立自由变化的数目就是(n-1)个.
*
离中趋势的度量
*