文档介绍:非参数统计实验指导书
一、概述
前面已经学习了参数估计与假设检验,其内容是在已知总体分布的条件下对一些主要参数(如均值、方差)进行估计和检验。在进行参数估计和假设检验时一般要求总体服从正态分布,方差相等等假设条件,但在统计分析中许多实际问题并不一定满足这些假定,或者有些资料不是数值型(定距尺度),而是定类数据或定序数据,再用传统的参数方法进行分析就无能为力。
一般把不是参数的估计和检验问题已经不是建立在总体分布服从一定假设的基础上的有关统计方法,都称为非参数统计。与参数统计方法相比较,非参数统计方法具有以下优点:
,适用范围广;
,可以较快取得结果,节省时间;
,不需要太多的数学和统计理论;
,如定类尺度、定序尺度。
但是,由于非参数统计方法简单,计量水准低,损失了资料中的部分信息,因此当能与参数统计方法同时使用时,其敏感程度较低,检验的功效也较差。
二、二项检验
二项分布是一种不连续分布,对一个由指定数目的试验组成的不确定过程进行描述。每次试验只能有两种可能结果,成功或失败(是或否,1或0等),每次试验成功的概率是一个常数且独立于其他试验结果。二项分布描述在指定数目的试验中成功的总次数,需要两个参数,一个是试验次数(n),一个是每次试验成功的概率(P)。
二项检验主要用来检验一个样本序列是否服从给定概率p的二项分布。将容量为n的样本数据转换为0,1数据,然后计算出1(成功)的个数n(1),n(1)应服从二项分布b(n,p)。建立检验假设如下:
(一)双侧检验 H0:p=p0(样本服从二项分布b(n,p0))
H1:p≠p0(样本不服从二项分布b(n,p0))
(二)左侧检验 H0:p=p0(样本的成功概率大于等于给定概率p0)
H1:p<p0(样本的成功概率小于给定概率p0)
(三)右侧检验 H0:p=p0(样本的成功概率小于等于给定概率p0)
H1:p>p0(样本的成功概率大于给定概率p0)
根据一定的显著水平,计算出临界值上限和下限。如统计量n(1)超出临界值范围,则拒绝H0;否则就接受H0。
例:某种超常记忆训练法声称可以让80%的普通学生在1个小时内掌握60个单词,现随机抽取20个学生进行训练,,试检验该训练法的成功(1小时掌握60个单词)(α=)?
双侧检验 H0:p=(样本服从二项分布b(20,))
H1:p≠(样本不服从二项分布b(20,))
左侧检验 H0:p=()
H1:p<()
右侧检验 H0:p=()
H1:p>()
二项检验
其操作步骤为:(为节约笔墨,在操作说明中省略标题等说明文字的输入过程。)
;
,在C2输入=IF(B2>=60,1,0),拖拉填充句柄往下一直复制到C21处;
,在F2输入=COUNTIF(C2:C21,"=1");
,在F3输入=COUNTIF(C2:C21,"=0");
,在F4输入=F2+F3。
进一步对成功次数进行检验。
(一)双侧检验。
=BINOMDIST(F2,F4,F5,1),得单侧概率,为计算双侧概率,在单元F9输入=F8*2。
,,不是小概率事件,因此接受H0,。
也可以计算成功次数的临界值,然后根据n(1)是否超出临界值域,从而做出判定。
,在F11输入上限公式=CRITBINOM(F4,F5,1-F6/2),在F12输入下限公式=CRITBINOM(F4,F5,F6/2)。
用b1代表下限,b2代表上限,因显著水平α=,,。计算得下限b1=12,上限b2=19,由成功次数n(1)=13,在临界值范围内,因此接受H0,。
(二)左侧检验
如果选择左侧检验,则只需计算下限b1,。
=CRITBINOM(F4,F5,F6)。
得下限b1=13,由于n(1)≤b1,因此拒绝H0,。
(三)右侧检验
如果选择右侧检验,显