文档介绍:
众所周知,总体的全部信息可以通过其分布函数反映出来,但实际上,参数往往未知,,对总体参数或分布函数的表达式做出某种假设(称为统计假设),再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验.
1. 问题的提法
统计检验(假设检验)
这种利用样本检验统计假设真伪的过程叫做
在许多实际研究中,:某批产品能否出厂?某生产线工作是否正常?某人是否患有某种疾病?某种新药的治疗效果是否提高了?发生事故是否与星期几有关?某次水平考试是否正常?等等,都需要做出检验.
假设检验
参数假设检验
非参数假设检验:
X~F(x,θ),θ为参数
假设θ=θ0
例X~F(x),F(x)未知
假设 F(x)=F0(x)
~N(μ,σ2), 调查25个旅游者,得出一组样本观测值x1,x2,…,x25,若有专家认为消费额的期望值为μ0,如何由这组观测值验证这个说法?
假设检验为μ=μ0
~N(23,22),现用一简便方法测量6次得一组数据23,21,19,24,18,18(单位:十万分之一),问用简便方法测的有害气体含量是否有系统偏差?
假设检验μ=23,σ2=22
含量服从正态分布N(23,22),现用一简便方法测量6次得一组数据
23,21,19,24,18,18(单位:十万分之一),若用简便方法测得有害气体含量
的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差?
假设 H0: μ=23,
解:由题意得:用简便方法测得有害气体含量X~N(μ,22),
若H0成立,则
若取α=,则
P{|U|>z1-α/2}=α,
即: P{|U|>}=,
在假设成立的条件下,|U|>,一般认为:小概率事件在一次实验中是不会发生的,
将样本观测值代入U得
|u|>,
小概率事件在一次实验中发生了,
否定原假设,简便方法测得均值有系统偏差.
故假设不合情理,即:
2. 假设检验的基本思想
(1)小概率原理(实际推断原理)认为概率很小的事件在一次试验中实际上不会出现,并且小概率事件在一次试验中出现了,就被认为是不合理的.
(2)基本思想:先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件),这与小概率原理相违背,表明原来的假设有问题,应予以否定,,就没有理由否定这个假设,表明试验或抽样结果支持这个假设,这时称假设与实验结果是相容的,或者说可以接受原来的假设.
另一方面,当原假设不成立时,却作出接受原假设的结论,造成犯“取伪”的错误,称为第二类错误,
3. 假设检验的两类错误
在假设检验中,否定原假设的理由是小概率事件在一次试验中出现了,但小概率事件并不是不会出现,只是出现的可能性较小,即出现的概率不超过很小的正数,
就是犯第一类错误的概率的最大允许值.
一般用表示犯第二类错误的概率.
因此,根据小概率原理否定原假设,有可能把本来客观上正确的假设否定了,造成犯“弃真”的错误,称为第一类错误,
在进行假设检验时,我们采取的原则是:
控制犯第一类错误(即事先给定且很小)的同时使犯第二类错误的概率达到最小.
当样本容量一定时, 小, 就大,反之, 小, 就大.
另外,一般,
即使碰巧出现,也决不能把“犯第一类错误”和
“犯第二类错误”理解为相互对立的事件.
3. 假设检验的两类错误
弃真
充伪
α/2
α/2
X
φ(x)
增大样本容量n时,可以使α和β同时减小.
注意:
z1-α/2
- z1-α/2
β
μ=μ0
μ≠μ0(μ>μ0)
小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取α=,,,
α为检验的显著性水平(检验水平).
4. 显著性水平与否定域
在假设检验过程中,使得小概率事件出现的统计量的取值范围称为该假设检验的否定域(拒绝域),
否定域的边界称为该假设检验的临界值.
α/2
α/2
X
φ(x)
接受域
P{|U|<u1-α/2}=1-α
否定域的大小,依赖于显著性水平的取值,
一般说来,显著性水平越高,即α越小,否定域也越小,这时原假设就越难否定.
注意:
否定域
否定域
z1-