文档介绍:类别间联系的呈现——对应分析
对应分析
问题的提出
分析分类变量间关系时,卡方检验只能给出总体有无关系的结论,但不能精心分析,在变量类别极多时于事无补
解决方案
直观展示:对应分析
问题在于:当属性变量A和B的状态较多时,很难透过列联表作出直观地揭示出变量之间的联系以及变量各分类之间的联系。主要表现在:
首先,由于变量的分类值较多使得交叉列联表行列数剧增,列联表庞大,不易于对列联表的直观观察。更主要的是,由于列联表的单元格数较多,极不易于揭示列联表中行列变量之间的联系。
其次,在变量分类值较多但样本量却不足够大时,生产的交叉列联表中会出现数据“稀疏”现象,不易于卡方检验等分析方法的运用。
怎么办??
怎样简化列联表的结构?
利用降维的思想。如因子分析和主成分分析。但因子分析的缺陷是在于无法同时进行R型因子分析和Q型因子分析。
怎么办?
对应分析
对应分析是将R型因子分析与Q型因子分析结合起来进行统计分析的统计方法。
对变量进行因子分析称R型因子分析,对样本进行因子分析称Q型因子分析
对应分析从R型因子分析出发,而直接获得Q型因子的分析结果。
根据R型和Q型分析的内在联系,将变量和指标同时反映到相同坐标轴的一张图形上,便于对问题分析。
对应分析提供三个方面的信息:
指标之间的信息
样本之间的信息
指标与样本之间的信息
这些关系是通过作图来表示的。
特点
对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。
是多维图示分析技术之一,结果直观、简单
用于展示两个或多个分类变量各类间的关系
如是否独生子女、家庭所在地、家庭年收入、月花费与手机价格和属性偏好有无关联
假如依据该例数据研究家庭年收入、家庭类型(单身、两口之家、三口之家、与父母同住)、户主年龄与户型选择方面的关系,力图发现这些因素对户型选择的影响与倾向。
各个变量的类别较多时较佳
均为四类以上
2、对应分析的基本思想:
首先,编制两品质型变量的交叉列联表,将交叉列联表中的每个数据单元看成两变量在相应类别上的对应点;
然后,对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;
最后,通过观察对应分布图就能直观地把握变量类别之间的联系.
对应分析分为定性资料(分类资料)的对应分析和连续性资料的对应分析(基于均数的对应分析)
根据分析变量个数的多少,定性资料的对应分析又分为简单对应分析和多重对应分析。
对两个分类变量进行的对应分析称为简单对应分析;
对两个以上的分类变量进行的对应分析称为多重对应分析。
起名为“波澜”恰当吗
中美纯水有限公司欲为其新推出的一种纯水产品起一个合适的名字,为此专门委托了当地的策划咨询公司,取了一个名字“波澜”。一个好的名字至少应该满足两个条件:
1)会使消费者联想到正确的产品“纯水”;
2)会使消费者产生与正确产品密切相关的联想,如“纯净”、“清爽”等。
后来中美纯水有限公司委托调查统计研究所,进行了一次全面的市场研究,在调查中还包括简单的名称测试。调查的代码和含义如下: