文档介绍:第四节抽样误差与假设检验
一、抽样误差的概念
(一)均数的抽样误差与标准误
在医学科研中常采用抽样研究的方法,由于存在个体差异,样本均数一般不恰好等于总体均数,这种由个体变异产生的、由抽样误差造成的样本均数与样本均数以及样本均数与总体均数之间的差异( )称为均数的抽样误差。抽样误差在抽样研究中是不可避免的。但有一定的规律可循,我们可以用特定的指标来描述抽样误差的大小。
用样本信息来推断相应总体的特征,这一过程称为统计推断。
统计推断包括两方面的内容:参数估计和假设检验
为了与反映观察值离散程度的标准差相区别,统计学上把样本均数的标准差称为样本均数的标准误,简称为标准误(standard error),其值越大就说明均数的抽样误差就越大,样本均数的离散程度就越高,也就是与总体均数的差异程度越大。
抽样实验:假定从13岁女学生身高总体均μ=,总体标准差σ= 的正态总体中进行随机抽样。
样本均数的分布特点:
;
;
,围绕着总体均数,中间多,两边少,左右基本对称,也服从正态分布。
数理统计证明:
从正态分布N(μ,σ2)中随机抽取例数为n的样本,其样本均数的分布仍服从正态分布;即使总体不呈正态分布,只要n很大, 的分布也近似正态分布N(μ, )。
均数标准误(理论值)的计算公式为:
样本均数的标准差是说明均数抽样误差大小的指标。大,抽样误差也大,反之,抽样误差小。
而在实际工作中只有用S估计σ,故标准误的估计值计算公式为
例4-4-1 用例4-2-1某地101例30~40岁骨科病人血清胆固醇值资料计算标准误
均数标准误的用途:
衡量样本均数的可靠性,其值越小则用其估计总体均数越可靠;
结合样本均数和正态分布曲线下的面积分布规律,可用于估计总体均数的置信区间(后述);
可用于均数的假设检验(后述)。