文档介绍:第十一讲第三章误差和分析数据和得理 11-1
3-4 有限测定数据的统计处理
一、置信度与μ的置信区间
日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,测定值总是在以μ为中心的一定范围内波动,并有着向μ集中的趋势。因此,如何根据有限的测定结果来估计μ可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与μ愈接近,即测定的准确度愈高。但由于测定次数毕竟较少,由此计算出的置信区间也不可能以百分之百的把握将μ包含在内,只能以一定的概率进行判断。
第十一讲第三章误差和分析数据和得理 11-2
(一) 已知总体标准偏差σ时
对于经常进行测定的某种试样,由于已经积累了大量的测定数据,可以认为σ是已知的。根据(3-14)式并考虑u的符号可得:
(3-14a)
由随机误差的区间概率可知,测定值出现的概率由u决定。例如,当u=±。x在μ-+。如果希望用单次测定值x来估计μ可能存在的范围,则可以认为区间x±。即有
(3-14b)
第十一讲第三章误差和分析数据和得理 11-3
由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有
式(3-14b)和式(3-17)分别表示在一定的置信度时,以单次测定值x或以平均值为中心的包含真值的取值范围,即μ的置信区间。在置信区间内包含μ的概率称为置信度,它表明了人们对所作的判断有把握的程度,用P表示。u值可由表3-1中查到,它与一定的置信度相对应。
(3-17)
第十一讲第三章误差和分析数据和得理 11-4
在对真值进行区间估计时,置信度的高低要定得恰当。一般以95%或90%的把握即可。
式(3-14b)和式(3-17)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。当σ一定时,置信度定得愈大,∣u∣值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或越接近真值,即测定的准确度越高。
例题1:
第十一讲第三章误差和分析数据和得理 11-5
注意:μ是确定且客观存在的,它没有随机性。而区间x±uσ或是具有随机性的,即它们均与一定的置信度相联系。,。
(二)已知样本标准偏差S时
在实际工作中,通过有限次的测定是无法得知μ和σ的,只能求出和S。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用S代替σ从而对μ作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。
第十一讲第三章误差和分析数据和得理 11-5
t分布法:t值的定义:
(3-18)
t分布是有限测定数据及其随机误差的分布规律。t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。显然,在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。
第十一讲第三章误差和分析数据和得理 11-7
图3-6 t分布曲线
第十一讲第三章误差和分析数据和得理 11-8
与正态分布曲线一样,t分布曲线下面某区间的面积也表示随机误差在此区间的概率。但t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的t值见表3-2中。
第十一讲第三章误差和分析数据和得理 11-9
表3-2 tP,f值表(双边)
t 值 P 90% 95% 99% %
f(n-1)
1
2
3
4
5
6
7
8
9
10
20
30 ()
60