文档介绍:第六章次数资料的统计分析
第三章述及,试验资料可分为两种类型,即数量性状资料和质量性状资料。对于质量性状资料往往难于用数量水平表示,而只能用某种属性性状出现的次数表示。例如将有芒白粒小麦与无芒红粒小麦杂交,在后代会出现有芒白粒、有芒红粒、无芒白粒、无芒红粒等植株类型,每一种类型代表一种属性。对于每一种类型的个体,表达其属性程度,用量值很难测定,而统计各种类型出现的次数却显然是合理而又方便的。
此外,数量性状有时也能用次数表示。例如:植株的高度,我们测量每一个个体的高度得到的变数是连续性变数,如果把植株的高度按一定标准分成高、中、矮三种类型,计数各类型的株数,则得到的资料也是次数资料。另外,间断性变数也能用次数表示,例如在玉米群体中,按果穗的多少有0(空杆)、1(单穗)、2(双穗)等,如果记录每株的穗数,就是间断性变数;如果统计空杆、单穗、双穗等类型出现的次数,就是一种次数资料。
因此,不论质量性状或数量性状,都是可以用次数表示的。凡是试验结果用某种类型出现的次数表示的,叫做次数资料或计数资料。
第一节次数资料的测验
对次数资料的假设测验可通过分布进行,这里用到了分布的一个应用公式:
()
式中O 为次数变数的实际观察次数,E 为对应于O 的理论次数,K为组数。
本应用公式由K. Pearson 于1899年提出,并指出,当自由度大于1时,其与分布相近似;当自由度大于1,且Ei不少于5时,其与分布近似相当好;仅当自由度等于1时,两者稍有出入,应予以矫正。这一次数资料统计量的一大优点就是对所
研究的对象属于何种分布并无要求,这就使得它的应用范围相当广泛而简便,而且从应用范围上讲,它既可应用于二项分布资料,也可应用于分类数大于2的多项分布(multinomial distribution)资料,因此,从统计功能上讲,其涵盖了后面将要介绍的二项分布资料假设测验。
一、次数资料适合性的假设测验
这一假设测验是测验某一次数资料的样本结果是否符合假设的理论次数分布,下面以实例讲解。
〔〕某地农田杂草谱调查表明,在常规耕作方法下,田间三种主要杂草分布比率为,一年生杂草:一年生阔叶:宿根性杂草=30:30:40。今采用深翻后,得调查结果如下,试测验杂草谱分布有无发生改变?
田间杂草谱分布适合性测验资料
杂草类别
一年生杂草
一年生阔叶
宿根性杂草
总次数
实测次数(O)
理论次数(E)
21
23
10
54
54
①HO:深翻后,杂草谱分布未发生改变;对HA:深翻后,杂草谱分布发生了改变。
②显著水平
③由()式计算值
④推断:由于计算得=>=,故否定HO而接受HA,即深翻后比之常规耕作方法田间三种主要杂草分布比率发生了显著改变。
对于上述测验,需作两点说明。
①计算样本与理论分布适合性的分布自由度为该样本分类数减1。此来源于计算各理论值E 时,受到总次数确定的限制。
②适合性测验的接受备择假设与统计上的>相联系,另,本假设测验为的右尾一尾测验。书后附表4恰为分布的右尾概率临界值表,故通常无须标明有关一尾的说明。
二、次数资料独立性的假设测验
当次数资料每一变数均具有两种不同的调查目标性状时,其原始资料成为二维数据资料。。
此时,若欲对两类目标性状之间的独立性进行测验,即构成次数资料的独立性测验。
次数资料独立性测验的数据结构
横向分类(A)
纵向分类(B)
总计Ri
1
2 … j … C
1
2
┆
i
┆
r
O11
O21
┆
Oi1
┆
Or1
O12…O1j…O1c
O22…O2j…O2c
┆┆┆
Oi2…Oij…Oic
┆┆┆
Or2…Orj…Orc
R1
R2
┆
Ri
┆
Rr
总计Cj
C1 C2… Cj …Cc
〔〕测定不同密度下玉米每株穗数的分布,,试测验穗数分布是否与密度大小有关?
不同密度下玉米每株穗数的分布
密度(万株/hm2)
空杆株
一穗株
双穗及以上株
总计
3
6
9
12
12()
60()
246()
416()
224()
549()
659()
765()
76()
39()
28()
47()
312
647
933
1228
总计
734
2196
190
3120
①假设H0: 玉米每株穗数