1 / 18
文档名称:

聚类分析.ppt

格式:ppt   页数:18页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析.ppt

上传人:企业资源 2011/12/12 文件大小:0 KB

下载得到文件列表

聚类分析.ppt

文档介绍

文档介绍:聚类分析
聚类分析:对于总体分类未知的一群事物依照“物以类聚”思想,把性质相近的事物归入同一类,而把性质相差较大的事物归入不同类的一种统计分析方法。
聚类分析可以分为两种类型:一种是对样品聚类,另一种是对指标聚类。
一、  常用统计量
1. 聚类分析的数据格式
2. 聚类分析的常用统计量
(1) 距离系数d:第i个样品与第k个样品在P维
空间中的距离为:
dik= (i,k=1,2,...,n)
其中dii=0,dik=dki

根据dik的大小,可以对n个样品进行聚类,即把两两之间距离小的样品归入同一类,距离大的样品归入不同的类。
消除变量量纲对距离系数的影响
①标准正态差变换:
②极差变换:
(2) 相关系数rik
/ P , / P
当r ik 的绝对值越接近1时,表明第i个样品与第k个样品的相似程度越大,此时,便越有理由将它们归入同一类;反之,应将两个样品归入不同的类。
相关系数多用于指标之间的聚类。
二、聚类方法

系统聚类(systematic clucstering)法的基本思想是:先将n个样品各自看成一类。然后选择相似程度最大(距离系数dik最小或相关系数rik最大)的样品对归为一类;再选择相似程度次大的样品对归为一类。依次类推,直到所有的没有归入其他类的样品对都归类完为止。在进行归类过程中:
①若两样品在已经形成的类中没有出现过,则成立一
个新类;
②若两样品中有一个是在已经形成的类中出现过,则
另一样品加入该类;
③若两样品分别出现在已经形成的两个类中,则把这
两类归并为一大类;
④若两样品都在同一类中出现,则这一对样品就不再
归类了。
这样反复进行直到对所有样品都归类完毕为止,形成一个分类系统。
聚类结果树图:
0
5
10
15
3
5
1
2
6
8
10
9
4
7

最近更新

2024年江苏工程职业技术学院单招职业适应性测.. 56页

2024年河南应用技术职业学院单招职业适应性测.. 53页

2024年浙江省农科院事业单位招聘拟聘用人员历.. 88页

2024年浙江省宁波市象山县文化广电新闻出版局.. 59页

2024年浙江省衢州市衢江区事业单位招聘61人历.. 59页

2024年海南省东方市农业系统事业单位招聘19人.. 59页

2024年湖北武汉轻工大学党委宣传部招聘历年高.. 60页

2024年湖南外国语职业学院单招职业适应性测试.. 54页

2024年湖南湘西事业单位招聘高层次人才130人历.. 89页

2024年湖南省永州市新田县人民陪审员招聘80人.. 60页

2024年湖南邵阳武冈市事业单位招聘169人历年高.. 88页

2024年湖南长沙市开福区清水塘街道招聘文秘历.. 89页

2024年漳州城市职业学院单招职业适应性测试题.. 55页

2024年甘肃兰州事业单位历年高频难、易点(公.. 90页

2024年甘肃省省直事业单位招聘工作人员280名历.. 88页

2024年石家庄职业技术学院单招职业适应性测试.. 56页

2024年福建永安市属事业单位招聘历年高频难、.. 279页

2024年秦皇岛职业技术学院单招职业适应性测试.. 53页

2024年苏州张家港市部分事业单位招聘90人历年.. 275页

2024年贵州毕节市“脱贫攻坚专项引才”885人招.. 279页

2024年贵州省务川县事业单位招聘105人历年高频.. 282页

2024年贵州省德江县事业单位招聘170人历年高频.. 89页

码头安全生产培训 27页

公租房承诺书 2页

苗木种植反季节施工方案 6页

10kV出线柜内10kV电流互感器更换施工方案 9页

并联式混合动力汽车的能量管理系统研究-工程硕.. 75页

110kv变电站保护配置及选型 48页

英语人教版八年级下册Hansel and Gretel 27页

宁夏大学届毕业生就业协议书和表使用注意事项.. 7页