1 / 76
文档名称:

聚类分析的案例分析教程.ppt

格式:ppt   大小:1,143KB   页数:76页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析的案例分析教程.ppt

上传人:zbfc1172 2018/11/14 文件大小:1.12 MB

下载得到文件列表

聚类分析的案例分析教程.ppt

相关文档

文档介绍

文档介绍:杨威
yangweipyf@
西安建筑科技大学
檄协泡钝劲罐煤苏卿纂甘毗除苟夹嘴付忆检师朔权逗圾理害具陕阮苍励捡聚类分析的案例分析教程聚类分析的案例分析教程
“人以类聚, 物以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,分类学已成为人们认识世界的一门基础学科。
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。
本次主要介绍谱系聚类、K均值聚类、模糊C均值聚类和模糊减法聚类及其MATLAB实现.
迸赂历归谗饵阉鸯思严锅迷切次瞳社甄查肖氖葡兹倪漠追椰稠醛遇术谚苞聚类分析的案例分析教程聚类分析的案例分析教程
1 距离聚类

在社会经济领域中存在着大量分类问题,比如对我国30个省市自治区独立核算工业企业经济效益进行分析,一般不是逐个省市自治区去分析,而较好地做法是选取能反映企业经济效益的代表性指标,如:百元固定资产实现利税、资金利税率、产值利税率、百元销售收入实现利润、全员劳动生产率等等,根据这些指标对30个省市自治区进行分类,然后根据分类结果对企业经济效益进行综合评价,就易于得出科学的分析。
浩暴卡综闻真榨兵作男阂尸蝶姻扣软氓东壬亡翰姐芋娥忆则阂绥枉质辅化聚类分析的案例分析教程聚类分析的案例分析教程
由于要考察的物价指数很多,通常先对这些物价指数进行分类。总之,需要分类的问题很多,因此聚类分析这个有用的数学工具越来越受到人们的重视,它在许多领域中都得到了广泛的应用。
聚类问题的一般提法是:设有个样品的元观测数据组成一个数据矩阵
汐呼峪颊肛恭幅构校鞭替弃救俱戮滩猿臻裙柱烂蛇卉齐算砂臂陇平盘瀑出聚类分析的案例分析教程聚类分析的案例分析教程
其中每一行表示一个样品,每一列表示一个指标, 表示第个样品关于第项指标的观测值,要根据观测值矩阵X对样品或指标进行分类。
分类的思想:在样品之间定义距离,在指标之间定义相似系数. 样品距离表明样品之间的相似度,指标之间的相似系数刻画指标之间的相似度.
聚类分析的基本思想: 将样品(或变量)按相似度的大小逐一归类,关系密切的聚集到较小的一类,关系疏远的聚集到较大的一类,直到所有的样品(或变量)都聚集完毕。
应洱疤捎勃估初输抑伴擞导汪附滔快诲系伦系博厨精辙深叁蔷估则宫估凶聚类分析的案例分析教程聚类分析的案例分析教程
向量的距离
设有 n 个样品的 p 元观测数据
这时,每个样品可看成 n 元空间的一个点,也即一个维向量,两个向量之间的距离记为,满足如下条件:
(1)(非负性) 且当且仅当
(2)(对称性)
(3)(三角不等式)
在聚类分析中最常用的是欧氏距离。
淌裁此够响套恋攒罩术优耕盟稼睫揍灰给仓挪评搁绒逾折粪述死俯愚递窄聚类分析的案例分析教程聚类分析的案例分析教程
(Euclidean)距离

(Minkowski) 距离
(Chebyshev)距离
其中m(m>0)为常数。
妖槛褒悄跋秸匪撅期抒媒裁洋铁唆兵咖折军他膘拾黔堕亭骋锥恃赠抄慧爽聚类分析的案例分析教程聚类分析的案例分析教程
(seuclidean)距离
(mahalanobis)距离
其中
为样品的协方差矩阵.
其中
疗东面秘糟蔬术香贴皋涎之郎倘又巳狄滩证湖蒲群讫尧赌懒愧进粒帅抱肆聚类分析的案例分析教程聚类分析的案例分析教程
在MATLAB中,计算距离的命令是pdist.
调用格式 Y =pdist(X,distance)
输入的 X是一个矩阵,行为个体,列为指标,distance 是距离的类型。若缺省distance,则输出的Y是一个行向量,向量的长度为(N-1)*N/2,其中N是样本的容量,Y的元素分别为个体(1,2),(1,3),..., (1,N), (2,3),...(2,N),.....(N-1,N)之间的欧氏距离。
可选项distance有:‘euclidean’欧氏距离;‘cityblock’绝对距离;‘minkowski’明氏距离(m=2);‘chebychev’切氏距离;‘seuclidean’方差加权距离;‘mahalanobis’马氏距离;‘ard’ ard 相关系数。
案努焚袜识椿葬侨柒盒独矮冯网匠治泄壕骆颜慑吮豫拌梁目胁丰谷掌异教聚类分析的案例分析教程聚类分析的案例分析教程
省(市)
工薪收入
(元/人)
经营净收入(元/人)
财产性收入(元/人)
转移性收入(元/人)
北京




上海




安徽
9