文档介绍:生物统计与计算机辅助分析
Biostatistics puter Aid Analysis
主讲教师:
关瑞章冯建军
林鹏谢钦铭
郭松林黄文树
江兴龙黄良敏
2007-6-15
第六章拟合优度检验(即χ2检验)
拟合优度检验的一般原理
适合性检验
独立性检验
χ2的可加性
2007-6-15
第六章拟合优度检验(即χ2检验)
拟合优度检验的一般原理
•拟合优度检验是用来检验实际观测数与依照某种
假设或模型计算出来的理论数之间的一致性,以
便判断该假设或模型是否与观测数相配合。拟合
优度检验也会出现两种类型错误,如果某一模型
是正确的但拒绝了它,就会犯I型错误;当某一
模型并不正确,却错误地接受了,则会犯Ⅱ型错
误。
•皮尔逊()首创χ2统计量。应用中n
须要比较大且各组的理论次数皆大5时,该统计
量即可近似的服从χ2分布。若存在理论次数小于
5的组,则须加大样本容量,或将理论次数小于
5的组与邻组合并。
2007-6-15
χ2 检验的分类
1、适合性检验
检验总体是否与某种理论分布或模型
相符合,称为适合性检验。
2、独立性检验
按两个标志(两向)分类的记数资料
排成横行与纵列的表格,称为列联表。检
验列联表内横、纵两向的标志在个体上的
出现是否相关,称为独立性检验。
2007-6-15
用于χ2检验的三个公式
•已经证明当n 充分大时,由(1)式所定义的
统计量近似服从χ2分布,但要求每一组的理
论数不得小于5,否则应将相邻项合并,直
到大于或等于5,当df=1时,应做连续性校
正,校正式为(2)
k 2 k 2
2 −TO ii )( TO ii −−)(
χ= ∑)1( χ 2 = )2(
i. ∑
i=1 T i=1 Ti.
•自由度为= −1− akdf
2007-6-15
适合性检验
适合性检验一般程序
1 对数据进行分组;
2 根据总体分布类型和样本含量n计算理论数Ti;
3 有时需用样本数据估计总体参数。记所估计参数个
数为a;
4 合并两个尾区的理论数,使之不小于5,合并后的
组数计为k;
5 自由度为k-1-a,a为需要由样本估计的参数个数;
6 零假设:H0:O-T =0 ;
2 2 2 2
7 计算χ值并与临x 界值做比较,当χ> χα时拒绝
H0;反之接受H0。
2007-6-15
对二项分布的检验
1总体参数ϕ已知
例黄圆豌豆与绿皱豌豆杂交,第二代分
离数目如下:如问是否符合自由组合规
律?
Y_R_ Y_rr yyR_ Yyrr 总计
(黄圆) (黄皱) (绿圆) (绿皱)
315 101 108 32 556
2007-6-15
例题解答
解:当性状间相互独立时,根据孟德尔第二定
律,F2代的表现型可由二项分布给出,其中
ψ=3/4,n =2 。根据二项展开式
3 3 9 3 3 1
( )2 +++=+
4 4 16 16 16 16
可以得出理论分离比为:
9 3 3 1
:_:_:__ yyrryyRrrYRY = : : :
16 16 16 16
2007-6-15
例题解答(续) 将以上数据列成下表
Y_R_ Y_rr yyR- yyrr
实际观测数 315 101 108 32
理论频率p 9/16 3/16 3/16 1/16
理论数T
O-T - -
(O-T)2
(O-T)2/T
χ2=+++=
理论数Ti均大于5,不需合并,H0:O-T=0,α=
因为计算理论数时参数ϕ=3/4已知,不需要用样
本估计,因此a=0,df=4-1=3
2 2 2
χ 3,= χ< χ 接受H0,符合9:3:
3:1的分离比,df=3,不需矫正。
2007-6-15
例题解答(续)
df=1一定矫正,否则甚至会得到相反结论
例用正常翅的野生型果蝇与残翅的果蝇
杂交,F1代均表现为正常翅。F1代自交,
所得F2代中包括311个正常翅和81个残