文档介绍:第7章对应分析、(定类尺度或定序尺度)分类时所列出的频数表。(或多个)分类变量的统计学关联。如行变量与列变量之间的关联性。.一般,若总体中的个体可按两个属性A与B分类,A有n类A1,A2,…,An,B有p类B1,B2,…,Bp,属于Ai和Bj的个体数目为nij(i=1,2,…,n;j=1,2,…,p),nij称为频数,则可形成n×p的二维列联表,简称n×p表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。.列联表B1B2BjBpA1n11n12…n1j……p1j…,通常是计算相关系数和进行回归分析。描述两个定性变量之间的相关性是指广义的相关性,称为关联性。两个定性变量的关联程度在某种意义上就是指的“不独立”,它与独立的情形差距越大,就表明彼此的关系越密切,这种关系不一定是线性关系。在实际问题中,重要的是判断变量之间是否独立,因为不独立就意味着关联。最常用的检验办法是列联表独立性检验。列联表检验的零假设是两变量X和Y相互独立,计算一个卡方统计量,与列联表中频数取值和零假设下期望取值之差有关,当卡方很大时否定零假设。.例吸烟与慢性支气管炎调查表为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如表所示:设想有两个随机变量A,B:A:1表示吸烟,2表示不吸烟;B:1表示患慢性支气管炎,2表示未患。零假设为:H0:DFValueProbChi--Square-SquareMantel-HaenszelChi-SquareFisher'sExactTest(Left)-03(Right)(2-Tail)-03PhiCoefficient-Cramer'sV-SampleSize=,可以看出,吸烟人中患病的数目比期望数目大。检验的结果只要看后面的统计量部分的Chi-Square一行,,,所以应否定零假设,吸烟与患慢性支气管炎是不独立的。.对应分析又称为相应分析,也称R—Q分析。是因子分子基础发展起来的一种多元统计分析方法。它主要通过分析属性(定性)变量构成的列联表来揭示变量之间的关系,可以用对应分析图(二维图)显示列联表中每一个单元格的相对位置,以简单、直观地表明列联表的行与列的关系。对应分析也是利用降维的思想以达到简化数据结构的目的。不过,在因子分析中,R型因子分析和Q型因子分析是分开进行的。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。在对应分析中,会同时对行与列进行处理,寻求以低维图形表示数据表中的行与列的关系。(对同一观测数据施加R和Q型因子分析,并分别保留两个公共因子,则是对应分析的初步)。.