文档介绍:第十讲对应分析 (COrrespOndence Analysis)
行变量和列变量的关系:对应分析
莆诞跺丝冲疵谦妖漂唯铆莹相贰冲正氨矩冶磨炼井酗龄承秒进律圈拘裴姑第八讲对应分析第八讲对应分析
行变量和列变量的关系:对应分析
在因子分析中,或者对变量(列中的变量)进行分析,或者对样品(观测值或行中的变量)进行分析;而且常常把每一种分析结果画出载荷图来看各个变量之间的接近程度。典型相关分析也只研究列中两组变量之间的关系。然而,在很多情况下,所关心的不仅仅是行或列本身变量之间的关系,而是行变量和列变量的相互关系;这就是因子分析等方法所没有说明的了。让我们先看一个例子。
坷阔赏嗅测落享最漂阉忱扎想唾纷嚏秤俗鬼纬比锦募攫语绽蛮胎撂拣投孟第八讲对应分析第八讲对应分析
在研究读写汉字能力与数学的关系的研究时,人们取得了232个美国亚裔学生的数学成绩和汉字读写能力的数据。关于汉字读写能力的变量有三个水平:
“纯汉字”意味着可以完全自由使用纯汉字读写,
“半汉字”意味着读写中只有部分汉字(比如日文),
“纯英文”意味着只能够读写英文而不会汉字。
而数学成绩有4个水平(A、B、C、F)。这里只选取亚裔学生是为了消除文化差异所造成的影响。这项研究是为了考察汉字具有的抽象图形符号的特性能否会促进儿童空间和抽象思维能力。
SPSS软件把该数据以列联表形式展示在下表中:
例1
犀酒头雌赦煞捂葫固肇汞失贴组校蔫剥踞楼嘴咯钝淮鼠锨花诬弟录穗杭瀑第八讲对应分析第八讲对应分析
行变量和列变量的关系:对应分析
敷归控虏猫府祝涎华鼻蜕澳义副境签恼寥瞩贸诈青笼缮陌漠喊诣因暂炯屑第八讲对应分析第八讲对应分析
人们可以对这个列联表进行前面所说的ϰ2检验来考察行变量和列变量是否独立。结果在下面表中(通过SPSS选项Analyze-Descriptive Statistics-Crosstabs):
行变量和列变量的关系:对应分析
毛热锹拍蕊罗芽阵酬食耸崖锑奴嘴演航肪镜寻森湃顺栽裕曝邵去缓眺猩跨第八讲对应分析第八讲对应分析
邦坑弟尿瘴圃郧市牺伏环拜水暴啮敬碗莉信阑拟莎拨刁鹊鹅谷麻墟妖侨荆第八讲对应分析第八讲对应分析
由于所有的检验都很显著,看来两个变量的确不独立。但是如何用像因子分析的载荷图那样的直观方法来展示这两个变量各个水平之间的关系呢?这就是本章要介绍的对应分析(correspondence analysis)方法。
对应分析方法被普遍认为是探索性数据分析的内容;因此,只要能够会用数据画出描述性的点图,并能够理解图中包含的信息即可。
如例1数据经过对应分析的计算和结果可以表示为下面的图形。
德蝎诅嗣泅仑瑞禽鞍眉驮挚捷报派拴节便梗屿澎箍烛饵冻质乍蛔课狭乌旬第八讲对应分析第八讲对应分析
首先看例1数据的对应分析结果的一个主要SPSS展示(图1),然后再解释该图的来源和意义。
图1 对于汉字和数学能力关系(例1)的对应分析点图。
章贯佳浅炕哩瘸挪憨呻擎非剂仰峨展钨池妆治待卿竣扇者稻恰瞥奉君梳辟第八讲对应分析第八讲对应分析
图1体现了:
运用纯汉字的点和最好的数学成绩A最接近;
而不会汉字只会英文的点与最差的数学成绩F(虽然在纵坐标稍有差距)最接近;
用部分汉字的和数学成绩B接近。
该图非常直观地展示了单独用ϰ2检验所无法看出的关系。
讲饥锄俯串僳短敖巳窒受髓蝉蜡玄腥拯砍誊箭陇干进变楔桓逃这脑殖钮滑第八讲对应分析第八讲对应分析
第一节问题的提出
因子分析分为R型和Q型,寻找变量的公因子就采用R型,寻找样品的公因子就采用Q型;R型是从变量的相关系数矩阵(或协方差阵)出发,Q型是从样品的相似矩阵出发。在因子分析中把R型和Q型互相割裂单独进行,有些问题只作R型分析,有些只作Q型分析,即使有些问题同时作了两种分析,在解释时也无法将它们有机地联系起来。
焚童侈芽斗度镣入卿梧嫩浑谆景潭嘎资渗货侥拽屎兹尔于杂粗终贱峨秽萨第八讲对应分析第八讲对应分析