文档介绍:标准差
标准差(Standard Deviation), 也称 (mean square error), 是各数据偏离的距离的平均数,它是离均差xx平均后的方根,用。 表示。标准差是方差的。标准差能反映一个数据集的离散程度。平均 数相同的其检 测值应该很紧密的分散在真实值周围。如果不紧密,与真实值的距离 就会大,准确性当然也就不好了,不可能想象离散度大的方法,会测 出准确的结果。因此,离散度是评价方法的好坏的最重要也是最基本 的指标。
一组数据怎样去评价和量化它的离散度呢?人们使用了很多种方 法:
1 •极差
最直接也是最简单的方法,即最大值一最小值(也就是极差)来 评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛 中去掉最高最低分就是的具体应用。
由于误差的不可控性,因此只由两个数据来评判一组数据是不科 学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度 就是数据偏离平的程度。因此将数据与均值之差(我们叫它)加起来 就能反映出一个准确的离散程度。和越大离散度也就越大。
但是由于偶然误差是成的,离均差有正有负,对于大样本离均差 的代数和为零的。为了避免正负问题,在数学有上有两种方法:一种 是取绝对值,也就是常说的离均差绝对值之和。而为了避免符号问题, 数学上最常用的是另一种方法一一平方,这样就都成了非负数。因此, 离均差的XX成了评价离散度一个指标。
3・方差(S2)
由于离均差的xx与样本个数有关,只能反应相同样本的离散度, 而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的 影响,增加可比性,将标准差求平均值,这就是我们所说的方差成了 评价离散度的较好指标。
样本量越大越能反映真实的情况,而算数均值却完全忽略了这个 问题,对此上早有考虑,在统计学中样本的均差多是除以自由度
(n-1),它的意思是样本能的程度。当选到只剩一个时,它不可能再 有自由了,所以是n-l。
(SD)
由于是数据的平方,与检测值本身相差太大,人们难以直观的衡 量,所以常用方差开根号换算回来这就是我们要说的标准差。
在统计学中样本的均差多是除以自由度(n-1),它是意思是样本 能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以 自由度是n~lo (CV)
标准差能很客观准确的反映一组数据的离散程度,但是对于不同 的检目,或同一项目不同的样本,标准差就缺乏可比性了,因此对于 方法学评价来说又引入了变异系数CV。
一组数据的平均值及标准差常常同时做为参考的依据。在直觉 上,如果数值的中心以平均值来考虑,则标准差为统计分布之一 “自 然”的测量。
定义公式:其中N应为n-l,即自由度
变异系数(CV)
在描述波动情况的统计量时有一个变异系数cv=s/ (X的平均), 是用于不同数据的离散程度的比较变异系数就是几个数据的标准差 与均值的比值。求标准差的函数是STDEV求均值的函数是AVERAGE 比如你的数据分别在A1,A2,A3选中Bl,输入=STDEV(A1:A3)然后回 车 再选中C1,输入=AVERAGE(A1:A3)回车 再选中D1,输入=B1/C1 回车这样D1就是数据A1,A2,A3的变异系数了。一般变异系数用百 分数表示
异系数是一组数据的变异指标与其平均指标之比,它是一个相对 变异指标。变异系数有全距系数、平均差系数和标准差系数等。常 用的是标准差系数,用CV(Coefficient of Variance)表示。
CV(Coefficient of Variance):标准差与均值的比率。用公式表示 为:cV=o/u作用:反映单位均值上的离散程度,常用在两个总体 均值不等的离散程度的比较上。若两个总体的均值相等,则比较标准 差系数与比较标准差是等价的。变异系数又称离散系数。
标准差与平均值定义公式
1、 方差s 八 2二[(xl-x)"2+(x2-x厂 2+ (xn - x) ”2]/(n) (x 为
平均数)
2、 标准差二方差的算术xx
error baro在实验中单次测量总是难免会产生误差,为此我们 经常测量多次,然后用测量值的平均值表示测量的量,并用误差条来 表征数据的分布,其中误差条的高度为土标准误。这里即标准差 standard deviation和标准误standard error的计算公式分别为
标准差
= (V J~n) °
标准误
解释
从几何学的角度出发,标准差可以理解为一个从n维空间的一个 点到一条直线的距离的。举一个简单的例子,一组数据中有3个值, XI, X2, X3o它们可以在3维空间中确定一个点P二(XI, X2, X3)o想 像一条通过原点的直线。如果这组数据中的3个