文档介绍:第七章次数资料分析 ——2检验
本章将分别介绍对次数资料、等级资料进行统计分析的方法。
下一张
主页
退出
上一张
第一节2统计量与2分布
一、2统计量的意义
为了便于理解,现结合一实例说明2 (读作卡方) 统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某羊场一年所产的876只羔羊中,有公羔428只,母羔448只。按1:1的性别比例计算,公、母羔均应为438只。以A表示实际观察次数,T 表示理论次数,可将上述情况列成表7-1。
下一张
主页
退出
上一张
表7-1 羔羊性别实际观察次数与理论次数
下一张
主页
退出
上一张
从表7-1看到, 实际观察次数与理论次数存在一定的差异,这里公、母各相差10只。这个差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?
要回答这个问题, 首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度; 然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。
为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。从表7-1看出:A1-T1 =-10,A2-T2=10,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将两个差数A1-T1、A2-T2 平方后再相加,即计算∑(A-T)2,其值越大,实际观察次数与理论次数相差亦越大, 反之则越小。但利用∑(A-T)2表示实际观察次数与理论次数的偏离程度尚有不足。例如某一组实际观察次数为
下一张
主页
退出
上一张
505、理论次数为500,相差5;而另一组实际观察次数为26、理论次数为21,相差亦为5。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为2 ,即
下一张
主页
退出
上一张
(7-1)
也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量, 2越小,表明实际观察次数与理论次数越接近; 2 =0,表示两者完全吻合; 2越大,表示两者相差越大。
对于表7-1的资料,可计算得
表明实际观察次数与理论次数是比较接近的。
下一张
主页
退出
上一张
二、2分布
上面在属于离散型随机变量的次数资料的基础上引入了统计量2, 它近似地服从统计学中一种连续型随机变量的概率分布2分布。下面对统计学中的2分布作一简略介绍。
设有一平均数为μ、方差为的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、…、xn,并求出其标准正态离差:
, ,…,
下一张
主页
退出
上一张
记这n个相互独立的标准正态离差的平方和为2 :
(7-2)
它服从自由度为n的2分布,记为
~ 2 (n);
下一张
主页
退出
上一张
若用样本平均数代替总体平均数μ,则随机变量
(7-3)
服从自由度为n-1的2分布,记为
~
下一张
主页
退出
上一张