文档介绍:第23课
皮尔逊定理
今天我们证明概率的一个结论,这个结论在一些统计检验中很有用,有 r 个盒子
B1 …Br ,如图 所示:
图
假设有 n 个球 X1,,… X n 相互独立地随机地扔进这r 个盒子中,概率分别为:
Ρ∈=()X iiBp11,…Ρ∈=( XBpr) r
其中 pp1 +=… r 1,令v j 为扔进第j 个盒子里的球的数目:
n
vjnj==#{} ballsX1 ,…, X in the box B∑ I( Xl∈ Bj)
l=1
第 j 个盒子里平均应有球的数目为np j ,所以随机变量v j 应接近np j ,也可用中心极
限定理证明。下面的定理表明了对所有的 jr≤,如何在一定意义上同时描述 v j 与
np j 的接近程度。其主要困难源于随机变量v j 对 jr≤非独立。例如,由于球的总数
等于 n ,
vv1 +…+=r n
若知道了其中 n −1个盒子里的球的数目,自然就知道了第n 个盒子里球的数目。
定理:随机变量
2
r
()vnpjj−
2
∑→χr−1
j=1 np j
2
收敛,服从χr−1 分布,自由度为(r −1) 。
证明:考虑第j 个盒子 B j ,随机变量
I ()XB1 ∈∈j ,,… IXB( nj)
表明每个观察值是否在第个盒子是未知的,其概率服从伯努利分布:
X i j Bj B ()p j
EIX()11∈ Bj =Ρ( X ∈ Bjj) = p
方差为
Var( I( X1 ∈=− Bjj)) p(1 p j)
于是根据中心极限定理,随机变量
n
vnp− IX( lj∈− B) np j
jj= ∑l=1
np11−− p np p
jj() jj()
n
IX∈− B nE
∑l=1 ()lj
= → N ()0,1
nVar
服从标准正态分布,就有
vnp−
jj
→−10,10,1p jjNN() =() −p
np j
服从正态分布,方差为1− p j ,简单地非正式的写成
vnpjj−
→ Z j
np j
其中的随机变量。
Z j ∼ Np(0,1− j )
服从分布已经证明,但由于不独立,所以对证明很重要的它
Z j Np(0,1− j ) v j
们的相关结构 2 的分布还未知。要计算与的协方差,先计算:
∑ Z j Zi Z j
vnp− vnp−
ii和 jj
npi np j
的协方差
vnpvnpijjj−− 1 2
E =()Evij v −−+ Ev i np j Ev j np i n p i p j
npij np n p ij p
1122
=()Evij v −−+ np i np j np j np i n p i p j =()Evij v − n p i p j
nppij nppij
利用一个球不可能同时装进两个不同的盒子的事实,即:
IX( li∈