1 / 69
文档名称:

聚类与判别分析.ppt

格式:ppt   页数:69页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类与判别分析.ppt

上传人:wh7422 2015/6/3 文件大小:0 KB

下载得到文件列表

聚类与判别分析.ppt

文档介绍

文档介绍:聚类与判别分析
Clustering and discriminate analysis
主要内容
距离和相似系数
系统聚类(Hierarchical clustering)
最短距离法 最长距离法
中间距离法 可变距离法
重心法类平均法
可变类平均法 Ward最小方差法
聚类分析的正确应用
距离判别
Fisher判别
医用多元统计分析方法
系统聚类的基本思想
相近的聚为一类(以距离表示,样品聚类)
相似的聚为一类(以相似系数表示,变量聚类)
医用多元统计分析方法
6个不同民族的标化死亡率与出生时的期望寿命
民族
原始数据
标化死亡率(‰)
出生时期望寿命(岁)
满族


朝鲜族


蒙古族


维吾尔族


藏族


哈萨克族


均数


标准差


医用多元统计分析方法
距离
绝对值距离
欧氏(Euclidean)距离
切比雪夫(Chebychev)距离
明氏(Minkowski)距离
医用多元统计分析方法
缺点
没有考虑不同指标(变量)之间的单位和变异
兰氏(Lanberra)距离
没有考虑变量间的相关
医用多元统计分析方法
马氏(Mahalanobis)距离
多元T检验统计量
医用多元统计分析方法
配合距离
分类变量
设有两个样品,5个指标的取值分别为:
S1=(V,Q,S,T,K)
S2=(V,M,S,F,K)
相同称为配合的
不相同称为不配合的。
设两样品共有p个指标,其中配合者有m个,则两样品间的距离可定义为:
医用多元统计分析方法
相似系数
夹角余弦
Pearson相关系数
指数相似系数
医用多元统计分析方法
列联系数
点相关系数
四分相关系数
夹角余弦
Pearson列联系数
Cramer关联系数及修正关联系数
医用多元统计分析方法