1 / 4
文档名称:

交叉列联表分析【DOC精选】.doc

格式:doc   大小:215KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

交叉列联表分析【DOC精选】.doc

上传人:phljianjian 2017/2/22 文件大小:215 KB

下载得到文件列表

交叉列联表分析【DOC精选】.doc

文档介绍

文档介绍:交叉列联表分析--------- 用于分析属性数据 1. 属性变量与属性数据分析从变量的测量水平来看分为两类:连续变量和属性(Categorical) 变量,属性变量又可分为有序的(Ordinal) 和无序的变量。对属性数据进行分析,将达到以下几方面的目的: 1)产生汇总分类数据——列联表; 2)检验属性变量间的独立性(无关联性); 3)计算属性变量间的关联性统计量; 4)对高维数据进行分层分析和建模。在实际中,我们经常遇到判断两个或多个属性变量之间是否独立的问题,如:吸烟与患肺癌是否有关?色盲与性别是否有关?,利用?统计量作显著性检验来完成. 2 .列联表( Contingency Table ) 列联表是由两个以上的属性变量进行交叉分类的频数分布表。设二维随机变量( X ,Y ),X 可能取得值为 xxx r,,, 21?,Y 可能取得值为yyy s,,, 21?.现从总体中抽取容量为 n的样本,其中事件( X =x iY =y j ) 发生的频率为 n ji ( i= 1,2, …,r, j= 1,2, …,s,)记n i?=?? sj jin 1 ,n j?=?? ri jin 1 , 则有 n=???? ri sj jin 11 =??? ri in 1 =??? sj jn 1 ,将这些数据排列成如下的表: YXy 1y 2 …y sn i?x 1x 2┇x in 11n 21 …n s1n 12n 22 …n s2 …………n r1n r2 …n srn ?1n ?2┇n r?n j?n 1?n 2?…n s? n 这是一张 r×s列联表. 3. 属性变量的关联性分析对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想知道形成列联表的行和列变量间是否有某种关联性,即一个变量取不同数值时, 另一个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。属性变量关联性检验的假设为 H0 :变量之间无关联性; H1 :变量之间有关联性由于变量之间无关联性说明变量互相独立,所以原假设和备择假设可以写为: H0 :变量之间独立; H1 :变量之间不独立?检验 H 0:X 与Y 独立. 记P(X =x i ,η=y j )=p ji ,i=1,2,…,r, ,j=1,2,…,s, P(X =x i )=p i. ,i=1,2,…,r,P(Y =y j )=p j. ,j=1,2,…,s. 由离散性随机变量相互独立的定义,则原假设等价于 H 0:p ji =p j. ,i=1,2,…,r, ,j=1,2,…,s. 若p ji 已知,我们可以建立皮尔逊?统计量?=????? ri s ijji ji jip n p nn 1 1 2)( . 由皮尔逊定理知,?的极限分布为)1( 2? rs?.但这里 p ji 未知,因此用它的极大似然估计 p ij ?代替,这时检验统计量为?=??????? ri s ijji ji jip n p nn 1 1 2)( . 在H 0 成立的条件下, p ji =p j. ,即等价于用 p i?和p j?. 的极大似然估计 pi ??和pj ?? pi ??=n n i?, i=1, 2,…, r,pj