文档介绍:该【卡方-拟合优度检验 】是由【知识徜徉土豆】上传分享,文档一共【61】页,该文档可以免费在线阅读,需要了解更多关于【卡方-拟合优度检验 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。拟合优度检验的意义
判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
简单的说:*用于检验总体是否服从某个指定分布。
Ⅰ.检测观察数与理论数之间的一致性;
Ⅱ.通过检测观察数与理论数之间的一致性来判定事物之间的独立性。
§、拟合优度检验的一般原理
什么是拟合优度检验(P92)
一、 2统计量的意义
为了便于理解,现结合一实例说明2 (读作卡方) 统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某一年所产的876只实验动物,有雄性428只,雌性448只。按1:1的性别比例计算,雌雄均应为438只。以Oi表示实际观察次数,Ti 表 示 理 论次数,可将上述情况列成下表。
拟合优度检验的统计量(P92)
表 动物性别实际观察次数与理论次数
性别
实际观察
次数Oi
理论次数Ti
Oi-Ti
(Oi-Ti)2/Ti
雌
428
438
-10
雄
448
438
10
合计
876
876
0
为了弥补B这一不足,将各差数平方除以相应的理论次数后再相加,并记之为2 ,即
也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量, 2越小,表明实际观察次数与理论次数越接近; 2 =0,表示两者完全吻合; 2越大,表示两者相差越大。
二、2分布
上面引入了统计量2, 它近似地服从统计学中一种连续型随机变量的概率分布2分布。下面对统计学中的2分布作一简略介绍。
设有一平均数为μ、方差为 的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、…、xn,并求出其标准正态离差:
记这n个相互独立的标准正态离差的平方和为2 :
它服从自由度为n的2分布,记为
~ 2 (n);
若用样本平均数 代替总体平均数μ,则随机变量
服从自由度为n-1的2分布,记为
~
显 然 ,2≥0 , 即 2 的 取 值 范 围 是[0,+∞;2分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大, 曲线由偏斜渐趋于对称;df≥30时, 接近正态分布。下面给出了几个不同自由度的2概率分布密度曲线。
的连续性矫正
由公式计算的2只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。
Yates(1934)提出了一个矫正公式,矫正后的2值记为 :
= (7-2)
当自由度大于1时,原公式的2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大 于5 为止。