文档介绍:Chapter 9 Cluster analysis
zf
Presentation Outline(本章要点)
What is cluster analysis?
Similarities measures
Hierarchical cluster analysis
– Centroid method
– Single linkage
– Complete linkage
– Average linkage
– Ward’s method
– Number of clusters
Non-hierarchical cluster analysis
zf
2
一、什么是聚类分析 What is cluster analysis?
1、definition(定义)
Cluster analysis is a technique used bining observations into groups or clusters such that:
(1) Each group or cluster is homogeneous pact with respect to certain characteristics. That is, observations in each group are similar to each other.
(2) Each group should be different from other groups with respect to the same characteristics; that is, observations of one group should be different from the observations of other groups.
zf
3
聚类分析
是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。
将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。
聚类分析的目的
使类内对象的同质性最大化和类间对象的异质性最大化。
zf
4
聚类分析的基本思想:
是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕.
相似样本或指标的集合称为类。
zf
5
2、Applications(应用)
经济领域的应用如:
例1. One goal of marketing managers is to identify similar consumer segments so that marketing programs can be developed and tailored to each segment. For example, they might group customers by their lifestyles. The result could be one group that likes outdoor activities, another that enjoys entertainment and a third that likes cooking and gardening. Each segment may have distinct product needs and may respond differently to advertising approaches
zf
6
市场部经理可以依据消费者生活模式进行分类,分为:喜欢户外活动的消费者
喜欢娱乐活动的消费者
喜欢烹饪和园艺的消费者
不同的群体对产品需求可能有所不同,对产品广告反映也可能会有所不同。
市场部经理可针对不同的消费者群体制定不同的推销策略。
zf
7
例2、谁经常光顾商店,谁买什么东西,买多少?
按忠诚卡记录的光临次数、光临时间、性别、年龄、职业、购物种类、金额等变量分类
这样商店可以….
识别顾客购买模式(如喜欢一大早来买酸奶和鲜肉,习惯周末时一次性大采购)
刻画不同的客户群的特征(用变量来刻画,就象刻画猫和狗的特征一样)
zf
8
为什么这样分类?(分类的好处)
因为每一个类别里面的人消费方式都不一样,需要针对不同的人群,制定不同的关系管理方式,以提高客户对公司商业活动的参与率。
挖掘有价值的客户,并制定相应的促销策略:
如,对经常购买酸奶的客户
对累计消费达到12个月的老客户
针对潜在客户派发广告,比在大街上乱发传单命中率更高,成本更低!
zf
9
例3、谁是