文档介绍:前面已经研究了假设检验的基本思想,并讨论了当总体分布已知时,关于其中未知参数的假设检验问题. 然而可能遇到这样的情形, 总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设. 例如, 从1500 年到 1931 年的 432 年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这 432 年间共爆发了 299 次战争,具体数据如下:战争次数 X01234 223 142 48154 发生 X次战争的年数 Poisson 分布? 对总体分布进行检验的问题称为分布的拟合检验. 第四节分布拟合检验 2检验法是在总体 X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法. 基本思想:H 0:总体 X的分布函数为 F(x) ,: 一、χ 2拟合优度检验提出原假设:,可以算出总体 X的值落入每个 A i的概率 p i ,于是 np i就是落入 A i 的样本值的理论频数. X的取值范围分成 k个互不重迭的小区间(或小组) , 记作 A 1, A 2, …, A i个小区间 A i的样本值的个数记作 n i,称为实测频数. 所有实测频数之和 n 1 + n 2 + …+n k等于样本容量 n. 2 21 ( ) k i i ii n np np ????? i i n np ?它标志着经验分布与理论分布之间的差异的大小. 4. 皮尔逊引进如下统计量表示经验分布与理论分布之间的差异: 在理论分布已知的条件下, np i是常量实测频数理论频数其分布是什么? H 0:P(A i) =p i , i =1,2, ….k. Pearson 证明了如下 2 2 2 1 ( ) ( 1) ~ ???? ?? k i i ii n np k np ? ?若原假设中的理论分布 F(x)已经完全给定,那么当n充分大时,统计量注:若在 H 0下分布类型已知,但其参数未知,这时需要先用最大似然估计法估计参数,然后作检验. Fisher 证明了如下若原假设中的理论分布 F(x)中有 r个未知参数需用相应的最大似然估计来代替,那么当 n充分大时,统计量 2 2 2 1?( ) ( 1) ?~ ???? ??? k i i ii n np k r np ? ?定理 1:定理 2: 如果根据所给的样本值 x 1, x 2, .., x n算得统计量χ 2的实测值落入拒绝域,则拒绝原假设;否则就认为差异不显著而接受原假设. 分别得拒绝域: 2 2 1 { ( 1)} W k ?? ??? ?? 2 2 1 { ( 1)} W k r ?? ??? ???(不需估计参数)(估计 r个参数) 2 2 1 ( ) P ?? ???? ?查χ 2分布表可得临界值χ 21-α,使得根据以上定理,对给定的显著性水平α, 注: 皮尔逊定理是在 n无限增大时推导出来的,因而使用时要注意n要足够大以及 np i不太小这两个条件. 根据计算实践,要求 n不小于50以及 np i不小于 5. 否则应适当合并相邻区间,使 np i满足此要求. 60次,结果如下:试在α= 水平下检验其是否均匀? (P367) 7 8 12 11 9 13 60 次数 1 2 3 4 5 6 合计点数解: 这是一个分布的拟合优度检验,记出现点数 i 的概率为 p i , 提出假设: 0 1 2 6 1 : ... 6 H p p p ? ???检验的拒绝域为: 2 2 1 { ( 1)} W k ?? ??? ??现在α= ,k=6, 查表得 2 2 1