文档介绍:*
要 点
典型相关分析的数学表达方式,约束条件;
典型相关系数的数学含义;
典型变量的数学含义;
典型相关系数的显著性检验;
冗余分析;
典型相关的应用
第一页,共80页。
*
第一节 典型相关分析的基本思想
(一)想法
其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵; 是X和Y的协方差矩阵。
第十五页,共80页。
如果我们记两组变量的第一对线性组合为:
其中:
所以,典型相关分析就是求a1和b1,使uv达到最大。
第十六页,共80页。
(二)典型相关系数和典型变量的求法
在约束条件:
下,求a1和b1,使uv达到最大。令
第十七页,共80页。
*
根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求
的极大值,其中和是 Lagrange乘数。
第十八页,共80页。
将上面的3式分别左乘 和
第十九页,共80页。
将 左乘(3)的第二式,得
并将第一式代入,得
的特征根是 ,相应的特征向量为
第二十页,共80页。
将 左乘(3)的第一式,并将第二式代入,得
的特征根是 ,相应的特征向量为
第二十一页,共80页。
结论: 既是M1又是M2的特征根, 和 是相应于M1和M2的特征向量。
至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。
第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。
第二十二页,共80页。
在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:
在约束条件:
求使 达到最大的 和 。
第二十三页,共80页。
*
例 家庭特征与家庭消费之间的关系
为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:
分析两组变量之间的关系。
第二十四页,共80页。
X1
X2
y1
y2
y3
X1
X2
y1
y2
y3
变量间的相关系数矩阵
第二十五页,共80页。
典型相关分析
典型相
关系数
调整典型
相关系数
近似方差
典型相关系数的平方
1
2
第二十六页,共80页。
X组典型变量的系数
U1
U2
X1(就餐)
-
X2(电影)
Y组典型变量的系数
V1
V2
Y1(年龄)
Y2(收入)
-
Y3(文化)
第二十七页,共80页。
三、典型变量的性质
1、同一组变量的典型变量之间互不相关
X组的典型变量之间是相互独立的:
Y组的典型变量之间是相互独立的:
因为特征向量之间是正交的。故
第二十八页,共80页。
2、不同组变量的典型变量之间的相关性
不同组内一对典型变量之间的相关系数为:
同对相关系数为 ,不同对则为零。
第二十九页,共80页。
3、原始变量与典型变量之间的相关系数(典型载荷分析 )
原始变量相关系数矩阵
X典型变量系数矩阵
第三十页,共80页。
y典型变量系数矩阵
第三十一页,共80页。
第三十二页,共80页。
*
第三十三页,共80页。
第三十四页,共80页。
*
第三十五页,共80页。
*
例 家庭特征与家庭消费之间的关系
为了了解家庭的特征与其消费模式之间