1 / 9
文档名称:

费希尔判别法理论.docx

格式:docx   大小:443KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

费希尔判别法理论.docx

上传人:今晚不太方便 2017/8/4 文件大小:443 KB

下载得到文件列表

费希尔判别法理论.docx

文档介绍

文档介绍:费希尔判别
费希尔判别(或称典型判别)的基本思想是投影(或降维):用维向量的少数几个线性组合(称为费希尔判别函数或典型变量)(一般明显小于)来代替原始的个变量,以达到降维的目的,并根据这个判别函数对样品的归属做出判别或将各组分离。成功的降维将使样品的归类或组的分离更为方便和有效,并且可以对前三个判别函数作图,从直观的几何图像上区别各组。
在降维的过程中难免会有部分有用信息的损失,但只要使用的方法得当,我们可以最大限度地减少这种损失,从而保留尽可能多的有用信息,即关于能够反应组之间差异的信息。为便于理解,我们以下用一个简单的二维例子来加以说明。
图投影到某个方向再判别
如图所示,两个组的所有样品都测量了两个变量和,将所有()点画于直角坐标系上,一组的样品点用“×”表示,另一组的样品点用“○”表示。假定我们希望将二维空间的点投影到某个一维空间,即一条直线上,然后再对两组进行判别,则投影到不同的直线上,判别的效果一般是不同的。从图中可见,如果两组的点都投影到直线上则这两组的投影点在该直线上的分布几乎无任何差异,他们完全混合在一起,我们无法将这两组的点区别开来,这样的降维把反应两组间差异的信息都给损失了,显然是不可取的。事实上,最好的投影是投
影到直线上,因为它把两组的投影点很清楚地区分了开来,这种降维把有关两组差异的信息很好地保留了下来,几乎没有任何损失,如此就完全可以在一维的直线上作判别分析。
我们现考虑在中将组的维数据向量投影到某个具有最佳方向的上,即投影到上的点能最大限度地显现出各组之间的差异。
设来自组的维观测值为,,,将它们共同投影到某一维常数向量上,得到的投影点可分别对应线性组合,,。这样,所有的维观测值就简化为一维观测值。下面我们用表示组中的均值,表示所有组组的的总均值,即
式中,,。
对于任一用来投影的,我们需要给出一个能反映组之间分离程度的度量。比较图中的上、下半图,上半图三组均值之间的差异程度与下半图是相同的,而前者组之间的分离程度却明显高于后者,原因就在于前者的组内变差要远小于后者,后者组之间有较多重叠。因此,可以考虑将组之间的分离程度度量为相对其组内变差的组间变差。在以下的讨论中,我们需假定各组的协方差矩阵相同,即。
图三组之间的分离程度
的组间平方和
式中为组间平方和及叉积和矩阵。的组内平方和
式中为组内平方和及叉积和矩阵。
可用来度量的组之间分离程度的一个量是
我们应选择这样的,使得达到最大。由于对任意非零常数,用代替上式中的,将保持不变,故考虑对加以约束。我们希望判别函数具有单位方差,即,但因未知,于是用其联合无偏估计替代,所以的约束条件实际应为,即判别函数的联合样本方差为1。
设的全部非零特征值依次为,这里,且有
()
(通常情况下上式等号成立),相应的特征向量依次记为(标准化为,)。由()式知,当时达到最大值。所以,选择投影到上能使各组的投影点最大限度地分离,称为费希尔第一线性判别函数,简称第一判别函数。在许多情况下(如组数是大的,或者原始的数据向量维数是大的),仅仅使用第一判别函数也许不够,因为仅在这一个投影方向上组之间的差异可能还不够清晰,各组未能很好地分开。这时,我们应考虑建立第二线性组合,为使降维最具效率,应要求(在线性关系的意义上)不重复

最近更新

计算机组装与维护复习题 7页

一本书作文500字五年级上册西游记(9篇) 10页

2024年刮墨刀项目资金需求报告代可行性研究报.. 70页

2024年阀门项目投资申请报告代可行性研究报告.. 58页

高考后拿到录取通知书的简短祝福语一百二十九.. 138页

幼儿园中班教案9篇 16页

复杂网络分布式模型的平均一致性研究的开题报.. 2页

塘沽区地热试验研究中心基于IC卡热水使用管理.. 2页

基于随机规划的多阶段投资组合选择模型研究的.. 2页

基于谓词逻辑的月面巡视器任务规划方法研究的.. 2页

基于自发性空间实践的历史街区更新设计研究的.. 2页

基于粒计算的不确定性度量与特征选择方法研究.. 2页

2024年年度工作总结3篇(精品) 10页

2024年年度培训计划(锦集8篇) 24页

基于物理的三维烟雾模拟及其加速技术的研究的.. 2页

2024年年会邀请函(合集15篇) 16页

基于消息中间件的异构数据库集成的研究的开题.. 2页

2024年平行四边形面积教学反思 28页

基于模态参数小波神经网络的结构损伤识别方法.. 2页

2024年常用网络爱情句子 91页

基于智能IC卡的小型电源管理模块设计的开题报.. 2页

基于改进肖维涅算法的温室环境数据监测系统设.. 2页

基于持续改善理论的航天型号项目全面预算管理.. 2页

基于感官审评与化学计量学的茶叶色香味品质研.. 2页

基于微博内容的实时推荐系统的开题报告 2页

基于小波变换的拉曼光谱去噪方法及其定量评价.. 2页

2024年左右评课稿 6页

互联网解聘备案业务信息更正申请表模板 2页

软件产品渠道销售方案 3页

汽车总装车间个人总结 汽车总装车间心得(五篇.. 18页