文档介绍:第11讲
充分统计量(课本, 节)
假设 X1,,… X n 是来自总体{Ρ∈Θθ:θ}.的一个样本,记分布为Ρθ。设存在 A 和 B 满
足条件:
1. A 反映了样本 X1,,… X n 的全部信息;
2. B 是一个数值TTX= (1,,… Xn ),是对样本数据的简化,信息的提炼,只反映了样本
某方面的信息。
显然, A 比 B 反映的数据信息要多,实际上是对样本中有关θ信息的反映。然而,
在某种情况下,选择恰当的充分统计量T 可以反映与 A 一样多的有关θ的信息。
定义. 如果
'
Ρ=θ()X11,,……XTnnΡ( X ,, XT) ,()
'
即给定统计量T 时, ( XX1,,… n ) 的条件概率函数与参数θ无关,且等同于Ρ,则统
计量TT= (X1,,… Xn )称为充分统计量。
如果存在这样的充分统计量,也就说明了该统计量包含了有关参数θ的全部信息,除
该统计量外,样本中再也不含有关θ的任何新的信息。从另一个角度来思考这个问题就是为
什么 B 包含的有关参数θ的信息会与 A 包含的信息一样多?很简单,如果存在充分统计量,
' '
则Ρ(X1,,… XTn )与θ无关,根据Ρ( X1,,… XTn ) 的分布, B 可以产生新的样本
'' ' ''
X1 ,,… X n 。根据Ρ=θ()X11,,……XTnΡ( X ,, XTn) ,可得新样本 X1 ,,… X n 与
X1,,… X n 的分布相同,因此选择恰当的 B 可以包含样本的全部信息。
接下来,讲述如何获得充分统计量。
定理:(Neyman-Fisher 因子分解准则)
TTX= (1,,… Xn )是θ的充分统计量的充要条件是:样本( XX1,,… n ) 的联合概率函
数可以表示成:
fxxfxfxuxxvTxx()11,,…………nnnθ==()θθ( ) ( 11,,) ( ( ,,n) ,θ) (式 )
其中, u 是 x1,,… xn 的非负函数且与θ无关, vT( ,θ) 仅通过T 依赖于 x1,,… xn 。
证明:(以离散型分布为例)
1. 必要性证明
首先假定TTX= (1,,… Xn )是充分统计量,由于是离散型分
布,则有:
f ()xx11,,……nnθ=Ρθ( XxXx =1,, = n) ,
即联合概率函数为样本取具体值 x1,,… xn 时的概率取值。当 X11= xX,,… n= xn时,充分统
计量TTX= (1,,… Xn )。此时有:
Ρ=θθ()Xx11,,…… Xxnn ==Ρ===( Xx11,, XxTTXXnn ,( 1 ,,…n)).
根据条件概率的性质,上式中等式右边可以展开为:
Ρ=θ()Xx11,,…… XxTTXXnn == ,( 1 ,,n)
=Ρθθ()X11 = x,,…… Xnn = xTTX = ()1,, XnΡ() TTX = ()1,,… Xn.
联立所有上式可得:
fx( 11,,……… xnnθ) =Ρθθ() X = x1,, X = xTnn = TX() 1,,