1 / 73
文档名称:

聚类相关分析和主成分相关分析.ppt

格式:ppt   大小:5,402KB   页数:73页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类相关分析和主成分相关分析.ppt

上传人:坚持 2018/9/8 文件大小:5.28 MB

下载得到文件列表

聚类相关分析和主成分相关分析.ppt

文档介绍

文档介绍:聚类分析
上海应用技术学院
香料香精技术与工程学院
“物以类聚,人以群分”,现实世界中存在大量的分类问题。
一、什么是聚类分析?
聚类分析(Cluster Analysis)是物以类聚的一种统计分析法。
用于对事物类别的面貌尚不清楚,甚至在事前连总共有几类都不能确定的情况下进行分类的场合。
一、什么是聚类分析?
聚类是一个将数据集划分为若干组或类的过程,并使得同一个组内的数据对象具有较高的相似度;而不同组中的数据对象是不相似的。
相似或不相似的描述是基于数据描述属性的取值来确定的。通常就是利用(各对象间)距离来进行表示的。
许多领域,包括食品感官与品质分析,物种分类,风味物质研究等等
二、聚类分析的典型应用
在商业方面,聚类分析可以帮助市场人员发现顾客群中所存在的不同特征的组群;并可以利用购买模式来描述这些不同特征的顾客组群。
在生物方面,聚类分析可以用来获取动物或植物所存在的层次结构,以及根据基因功能对其进行分类以获得对人群中所固有的结构更深入的了解。
聚类还可以从地球观测数据库中帮助识别具有相似的土地使用情况的区域。
此外还可以帮助分类识别互联网上的文档以便进行信息发现。
二、聚类分析的典型应用
作为数据挖掘的一项功能,聚类分析还可以作为一个单独使用的工具,来帮助分析数据的分布、了解各数据类的特征、确定所感兴趣的数据类以便作进一步分析。
聚类分析也可以作为其它算法(诸如:分类和定性归纳算法)的预处理步骤。
二、聚类分析的典型应用
数据聚类分析是一个正在蓬勃发展的领域。聚类分析所涉及的领域包括:
数据挖掘、统计学、机器学****空间数据库技术、生物学和市场学等。由于各应用数据库所包含的数据量越来越大,聚类分析已成为数据挖掘研究中一个非常活跃的研究课题。
作为统计学的一个分支,聚类分析已有多年的研究历史,这些研究主要集中在基于距离的聚类分析方面。
许多统计软件包,诸如:SAS、SPSS 和S-PLUS等都包含它许多聚类分析工具。
二、聚类分析的典型应用
我们直观地来看,这个分类是否合理?
计算4号和6号得分的离差平方和:
(21-20)2+(23-23)2+(22-22)2=1
计算1号和2号得分的离差平方和:
(28-18)2+(29-23)2+(28-18)2=236
计算1号和3号得分的离差平方和为482,由此可见一般,4号和6号类型接近。
我们的问题是如何来选择样品间相似的测度指标,如何将有相似性的类连接起来?
三、聚类分析应用解析