1 / 6
文档名称:

应用统计学------lec28.pdf

格式:pdf   页数:6
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

应用统计学------lec28.pdf

上传人:中国课件站 2011/10/27 文件大小:0 KB

下载得到文件列表

应用统计学------lec28.pdf

文档介绍

文档介绍:第28课

柯尔莫戈洛夫——斯米尔诺夫检验

设有服从某一未知分布Ρ的独立同分布样本 X1,,… X n ,想要检验的假设是Ρ是一特定
的分布Ρ0 ,即在下面两个假设之间选择:
⎧H10: ΡΡ=

⎩H20: Ρ≠Ρ
在讨论连续分布的拟合优度检验时考虑过这个问题。但在这里,为了应用皮尔逊定理和χ 2 检
验,将这个分布离散化,考虑求导数后较弱的假设。根据柯尔莫戈洛夫和斯米尔诺夫(理论),
下面考虑一个避免了离散化但从某种意义上讲更相容的假设。
记 Fx()=Ρ( X1 ≤ x )为累积分布函数。即所谓经验分布函数:
1 n

Fnn()xXxIX=Ρ( ≤) =∑()i ≤x
n i=1
就是在水平 x 以下的样本点的比例。对任一 x∈
的固定点,大数定理给出:
1 n

Fni()xIXxIXxXxF=≤→Ε≤=Ρ≤=∑()()()(11x)
n i=1
即在集合(−∞, x] 中样本的比例逼近这个集合的概率。
易证明这个逼近对所有x∈
是一致的:
sup Fxn ()−→ Fx( ) 0
x∈

图 累积分布函数和经验分布函数
即 Fn 与 F 之间最大的差在概率上趋于 0。柯尔莫戈洛夫——斯米尔诺夫检验的最重要发现
就是这一最小界的分布与样本的分布无关。
定理 1. 分布 supxn∈
Fx()− Fx( ) 与F 无关。
证明:
为简单起见,假设F 是连续的,即这一分布是连续的。 F 的逆记作
Fy−1 ()=≥min{ xFxy : ( ) }
对变量 y 作变换 yFx= ( ) 或 x = Fy−1 ( ) ,可将下式写成
⎛⎞
⎛⎞−1
Ρ−≤=Ρ−⎜⎟sup Fnn()xFxt () ⎜⎟sup FFy()() yt≤
⎝⎠xy∈≤
⎝⎠01≤
应用经验分布函数的定义,有
11nn
−−11
Fni()Fy()= ∑∑ IXFy()≤=() IFXy()()i ≤
nnii==11
于是
⎛⎞⎛⎞1 n
−1
Ρ−⎜⎟sup FFni()() y y≤ t=Ρ⎜⎟sup ∑ IFX()() ≤ y− y≤ t
⎝⎠01≤≤yy⎝⎠01≤≤ n i=1
因为累积分布函数FX()1 为
−−11
Ρ≤=Ρ≤=()F ( Xt11) ( XFtFFt( )) ( ( )) =t
所以FX(i ) 在区间[0,1] 上是均匀分布的。
于是随机变量
UFXii=≤()for in
是相互独立的且在[0,1]上均匀分布。联合上述证明,得到
⎛⎞1 n
⎛⎞
Ρ−≤=Ρ≤−⎜⎟sup Fxni() Fx () t ⎜⎟sup ∑ IU() y y≤ t
⎝⎠xy∈≤
⎝⎠01≤n i=1
显然与 F 相互独立。

下一步,将主要结论用公式表示。这个主要结论是柯尔莫
戈洛夫——斯米尔诺夫检验的基础。首先注意到,对一固
定的 x ,CLT 暗含:

nF()n () x−→ Fx () N(0, Fx()( 1 − Fx ()))
Fx()()1− Fx(