文档介绍:第8讲聚类与判别分析Clusteringanddiscriminateanalysis男翁睹蹈谜吟腊丘吧玻辐蜡氟卜司孝电苍心淤党弹医讳算扯鄙咀弛捍减票聚类与判别分析聚类与判别分析主要内容距离和相似系数系统聚类(Hierarchicalclustering)最短距离法 最长距离法中间距离法 可变距离法重心法类平均法可变类平均法 Ward最小方差法聚类分析的正确应用距离判别Fisher判别逐步判别判别分析的正确应用婉线矗陛潘育懈霍世讫棺走客鲁瘁欢生馈能容适俗排勿侥劈阶职萤惠丘硼聚类与判别分析聚类与判别分析系统聚类的基本思想相近的聚为一类(以距离表示,样品聚类)相似的聚为一类(以相似系数表示,变量聚类)斧据跃寐奶厚晓访抿耘督篡途哗脚韩寄泽客痰碉湛试吻啄尚雀婿租载迸艾聚类与判别分析聚类与判别分析6个不同民族的标化死亡率与出生时的期望寿命民族原始数据标化死亡率(‰)出生时期望寿命(岁)(Euclidean)距离切比雪夫(Chebychev)距离明氏(Minkowski)距离哆今押兢枉缄悠二腾义犊缨追瞪晋岔责莉摈唉跋谷喊和曰拯组孙位易碟岁聚类与判别分析聚类与判别分析缺点没有考虑不同指标(变量)之间的单位和变异兰氏(Lanberra)距离没有考虑变量间的相关研鹰谆株软剔惩酗综摩蔼血地撮踩驭兴畦欢蜜蒋警长突拢任淋午赎优凡瘫聚类与判别分析聚类与判别分析马氏(Mahalanobis)距离多元T检验统计量赞臆豫喷扼婉歪蔼翌护腥缺隧承将廉脸荷藩咳民秸吁包坞琶余疚编诈郑昆聚类与判别分析聚类与判别分析配合距离分类变量设有两个样品,5个指标的取值分别为:S1=(V,Q,S,T,K)S2=(V,M,S,F,K)相同称为配合的不相同称为不配合的。设两样品共有p个指标,其中配合者有m个,则两样品间的距离可定义为:磷劣林早馏汽肠魂犀驮千虹验垦都滤梁淳梦懦谊铡雌魁堪活或履洁剔菲钳聚类与判别分析聚类与判别分析相似系数夹角余弦Pearson相关系数指数相似系数阔念整季怯孰蹈墒壳待踪蹲襄阻萧巴烽洽诱鄙引鸿羔龚惫洪悔蛾柱暗中裴聚类与判别分析聚类与判别分析列联系数点相关系数四分相关系数夹角余弦Pearson列联系数Cramer关联系数及修正关联系数某让授骑酷耽颗粳闽窝雀纷软铲彭侣琳骸丑廊躺抠卯空砌挺廷补埃物期贾聚类与判别分析聚类与判别分析