文档介绍:第25课
复合假设的拟合优度
(课本, 节)
设有随机样本 X1,,… X n ,可能取得有限个数值 B1,,… Br ,取值的概率分别为
p11=Ρ()XB =,,… pr =Ρ( XB = r) 均未知。
设想我们要检测一个假设:这个分布来自一个参数集{Ρθ:θ∈Θ} 。换句话说,如果记作
,那么要检验的假设是
pXj ()θ=Ρθ( =Bj )
所有,一定的成立
⎪⎧Hjrpp1 : ≤∈θθΘ= , jj( )
⎨
否则
⎩⎪Hpp2 : jj≠()θ
若要用一特定的θ来检测H1 ,可用统计量
2
r
()vnpjj−()θ
T = ∑
j=1 np j ()θ
2
和上一课的χ检验。因为要检验的是: ppjj= (θ) , j ≤ r ,θ∈Θ。θ的选择是很多的,
这就使证明变得复杂。解决方法如下:
( 步骤 1)假设 H1 成立,即对一定的θ∈Θ,Ρ=Ρ0 成立,这样就可以找到未知量θ的
统计量θ∗。
(步骤 2)检验事实上分布Ρ是否等于Ρ,用下面χ 2 检验的统计量
θ*
2
∗
r
()vnpjj−()θ
T =
∑∗
j=1 np j ()θ
这种方法看起来很自然,唯一的问题就是估计量θ∗的取值,以及θ∗的取值依赖数据的选择
这一事实如何影响T 的收敛性。如果令θ∗为最大似然估计,即使得似然函数
vv1 r
ϕ()θθ= pp1 ()… r () θ
为最大的θ。则统计量
2
∗
r
()vnpjj−()θ
T = ∼χ 2
∑∗ rs−−1
j=1 np j ()θ
2
收敛于χrs−−1 分布,自由度为rs−−1 。其中s 为参数θ的维数。这里假设sr≤−2 ,则自
由度≥ 1 。很显然,通过维数可以知道描述Θ集合的自由参数θ的个数。下面举例说明:
1. 伯努利分布族 Bp( ) 只含有一个自由参数 p ∈[0,1] 。于是集合Θ=[0,1] 的维数s =1 。
2. 正态分布族 N (μ,σ 2 ) 含有两个参数μ∈
和σ 2 ≥ 0 ,集合Θ=×
[0, ∞) 的维数
s = 2 。
3. 考虑在集合{0,1, 2}上的所有分布的族。分布
Ρ==Ρ==Ρ==()XpXpX0,12( 1,) ( 2) p3
由参数 p1 , p2 和 p3 来表达。由于 ppp123+ +=1 ,其中一个是非自由参数,如
p31=−1 pp − 2,另外两个参数属于图 所示的集合 p12∈∈−[0,1] ,pp[ 0,1 1]
由于 p1 和 p2 的和应不大于1,集合的维数 s = 2 。
图 三点分布的自由参数
例(课本 )假设一个基因含有两个可能的等位基因A1 和A2 ,这两个等位基因的
结合形成三种遗传型AA11 ,AA12 和AA22 。要检验的理论是:
Α1遗传给孩子的概率为θ⎫
⎬
Α2遗传给孩子的概率为1-θ⎭
遗传型的概率为
2
pAA11(θθ) =Ρ( 1) =
pAA21()θ=Ρ(2 ) =21θθ( −) (