文档介绍:第18讲
假设检验
(课本,第 8 章)
简单假设检验
设样本 XX1,,… n 在空间Χ上独立同分布,且都服从Ρ分布,样本 X 在空间Ρ上取值。
假定分布Ρ未知,但已知它是 k 个可能的分布中的一个, Ρ∈Ρ{ 1,,
Ρk }
对于数据XX1,,… n , 我们可以确定以下k 个简单假设:
⎧H11: Ρ=Ρ
⎪
⎪H 22: Ρ=Ρ
⎨
⎪
⎪
⎩H kk: Ρ=Ρ
之所以称其为简单假设,是因为对于每一个假设都有一个简单的问题,即分布Ρ是否与这个
特定的分布相同。
为从这些假设中确定分布,我们给定数据向量:
n
XX=∈()1,,… Xn Χ
接着要确定选择某个假设,也就是说,我们要找一种决策法则,该法则也是一种函数,使
n
δ:,Χ→{H1
H k }
需要说明的是该函数有时是随机的,因为有时一些假设很可能看起来是相同的,所以可
以从它们中间随意选取。随着我们讲解的深入,随机函数的思想将会更清晰地展现出来。现
在我们只是把它看作有关这组数据的一个简单函数。
假定第 i 个假设为真,即Ρ=Ρi ,则决策法则δ出错的概率为:
Ρ≠()δδH ii| HH =Ρ≠ i( i)
我们称之为第i 类错误或者 i 类错误。
在仅有两个假设 H1 和 H2 的情况下,第一类错误
即:αδ11=Ρ() ≠H 1
被称为决策法则δ的显著性大小或者显著性水平,进而,1 减第二类错误
即: βα=−1122 =−Ρ() δ≠H 22 =Ρ( δ=H 2)
也被称为决策法则δ的最优势。
理想情况下,我们希望所有类型的错误尽可能的小,但是很明显,他们之间需要一个对
换,因为如果我们想降低第一类错误,就要预测更多的第一类的假设条件,同时需要更多的
数据变量,在这种情况下,如果第二类假设为真,我们犯弃真错误的概率就会增大。在许多
实际问题中,不同类型的错误会有完全不同的含义。
例:
假设某个医疗测验,病人可能患有某种类型的疾病,我们的假设如下:
H1 : 正的; H2 :负的
则第一类错误为: Ρ=(δ H 21| H ) ,
即我们测定病人没有患该种疾病而事实上病人患有该种疾病。
第二类错误为: Ρ=(δ H12| H ) ,
即我们测定病人患有该种疾病而事实上病人并没有患该种疾病。很明显,以上错误属于完全
不同的两类。如果没有附加测试的话,第一种结局是病人得不到他所需要的治疗,第二种结
局是病人将得到他不需要的而且可能导致伤害的治疗。
例:
雷达导弹探测和识别。雷达所接受的图像(比如说是客机的图象)可能被测定为是导弹,
我们的假设如下:
H1 : 导弹; H2 :非导弹
则第一类错误为: Ρ=(δ H 21| H ) ,表示我们将漏过导弹。
第二类错误为: Ρ=(δ H 21| H ) ,表示我们错误地将客机当作目标(以前发生过)。
另一个例子是法庭上基于某些测试的有罪或者无罪的判决,像这样的例子有很多。所以,
在许多情况下,控制某种类型的错误是很有必要的,应确保这种类型的错误不超出某个可接
受的值,同时尽可能减小其他类型的错误。例如