1 / 9
文档名称:

第七章 聚类分析[统计学经典理论].doc

格式:doc   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第七章 聚类分析[统计学经典理论].doc

上传人:企业资源 2012/1/11 文件大小:0 KB

下载得到文件列表

第七章 聚类分析[统计学经典理论].doc

文档介绍

文档介绍:第七章聚类分析
§1 系统聚类法(I)
一、距离系数
聚类分析是研究“物以类聚”的一种统计方法,通常以“距离”和“相似系数”为依据来进行聚类。本节以“距离”为依据的有最短距离法、最长距离法及中间距离法等聚类方法。
设有n个样品,每个样品测定m个指标,其数据矩阵为:
计算点Xi与点Xj间的距离公式有:
(1)绝对值距离
(2)欧氏距离
(3)明氏距离
①即绝对值距离
②即欧氏距离
二、聚类步骤
(1)将n个样品各自成一类;
(2)计算样品间的距离,将距离最近的两个样品并成一类;
(3)计算新类与其余各类的距离,再将距离最近的两类合并,重复上述步骤直到所有样品归成一类为止。
三、聚类方法(最短距离法、最长距离法、中间距离法)
类与类之间的距离有许多定义的方法,就产生不同的聚类方法,以下用dij表示样品Xi与Xj间的距离,用Dij表示类Gi与Gj间的距离。首先介绍最短距离法、最长距离法及中间距离法。

(1)
(2)若,则新类Gr与其它各类Gk间距离:

(1)
(2)

b ma c
四、例题 a
例1 已知5个大豆品种及一个指标(荚数/株),试用最短距离法聚类,其观测数据如表
x1
x2
x3
x4
x5
荚数/株
61




解:采用
表1
D0
G1
G2
G3
G4
G5
G1={x1}
0
G2={x2}

0
G3={x3}


0
G4={x4}



0
G5={x5}




0
表2
D1
G6={x1,x2}
G3={x3}
G4={x4}
G5={x5}
G6={x1,x2}
0
G3={x3}

0
G4={x4}


0
G5={x5}



0
表3
D2
G6={x1,x2}
G3={x3}
G7={x4,x5}
G6={x1,x2}
0
G3={x3}

0
G7={x4,x5}


0
表4
D3
G6={x1,x2}
G8={x4,x5,x3}
G6={x1,x2}
0
G8={x4,x5,x3}

0
聚类表
分类数目
品种归类
距离系数
4
{x1,x2},{x3},{x4},{x5}

3
{x1,x2},{x3},{x4,x5}

2
{x1,x2},{x3,x4,x5}

1
{x1,x2,x3,x4,x5}

聚类图(谱系图)
例2 已知七个小麦品种及三个指标,试用最短距离法聚类,其观测数据如表:
单产(公斤/亩)
穗粒数(粒)
千粒重(克)
x1



x2



x3



x4



x5



x6



最近更新

二零二五年度智慧物业管理车位租赁及增值服务.. 43页

2025年最新版委托创作合同范文3篇 15页

河北省2025年安装定额第八册 7页

2025年最新植树节创意活动方案 13页

二零二五年度房地产小程序开发与在线营销服务.. 43页

宠物市场全球化趋势分析 34页

模具工程师工作计划 5页

桩基螺旋箍筋工程量计算方法 12页

2025年最新护士人员个人工作总结范文五篇 10页

二零二五年度工业大数据工厂承包分析合同3篇 44页

MOF基吸附材料在环保产业中的战略布局与发展趋.. 33页

AI与工业设计行业的深度融合:技术发展市场机.. 31页

二零二五年度小店铺劳动合同与员工培训进修及.. 38页

二零二五年度宿舍安全责任与应急预案协议3篇 40页

二零二五年度客运企业职工福利保障合同3篇 45页

打印机维修申请报告 29页

化工原理期末试题 16页

二零二五年度培训学校师资培训资料非竞争协议.. 35页

冀教版英语七年级上册期末测试卷1 16页

二零二五年度可持续发展项目对赌协议约定倍收.. 49页

2024版建设工程质量保证金 11页

2023北京东城区初一期末(下)英语试卷及答案 8页

淀粉样变学习ppt课件 27页

全国中学生物理竞赛实验指导书思考题参考答案.. 8页

室外道路及管网工程施工进度计划工期保证及赶.. 16页

DLT---电力建设施工质量验收及评价规程-第部分.. 37页

关于印发《自治区财政存量资金管理暂行办法》.. 11页

根据河北省电化教育馆《关于举办河北省第一届.. 86页

一梦漫言 41页

约伯记查经第一讲苦难与概论(于宏洁).doc 10页