文档介绍:聚类分析与判别分析阅读文献总结
聚类分析:根据一批样品的多个观测指标,具体找出一些能够度量样品之间相似程度的统计 量,以这些统计量为划分依据,把一些相似程度较大的样品聚合为一类,把另外一些彼此之 间相似程度较大的样品聚合为另一类……关系密聚类分析与判别分析阅读文献总结
聚类分析:根据一批样品的多个观测指标,具体找出一些能够度量样品之间相似程度的统计 量,以这些统计量为划分依据,把一些相似程度较大的样品聚合为一类,把另外一些彼此之 间相似程度较大的样品聚合为另一类……关系密切的聚合到一个小的分类单位,关系疏远的 聚合到一个大的分类单位,直到把所有的样品都聚合完毕。
聚类分析给的方法大致可归纳为:(1)系统聚类法。(2)模糊聚类法。(3) K-均值法。(4)有序 样品的聚类。(5)分解法。(6)加入法。
相似性度量:用距离来度量样品之间的接近程度,如绝对值距离,欧氏距离,马氏距离,明 考斯基距离,切比雪夫距离等
计算类与类之间距离的方法:最短距离法,最长距离法,类平均法,重心法,离差平方和法
判别分析:贝叶斯判别和Fisher判别。
贝叶斯判别就是将贝叶斯统计思想应用于判别分析,通过贝叶斯判别得到判别函数后,将样 本带入判别函数中,得到相应的函数值,哪个函数值最大,则将该样本分类到该判别函数所 对应的组中。Fisher判别的基本思想将数据投影到某一个方向,使得投影后的组与组之间尽 可能地分开。
聚类分析文献:(1)近红外光谱结合聚类分析鉴别铁棍山药和白玉山药,(2)近红外光谱法对 不同蒸制时间地黄的鉴别研究
文献(1)和(2)都采用Ward方法(离差平方和法)进行聚类分析,最终得到样本的聚类分析树 状图
判别分析文献:(3)利用近红外光谱技术对葡萄酒原产地进行,(4)不同成熟度烤烟鲜叶的高 光谱响应及其判别分析
其中文献(3)中Fisher (这里的Fisher就指是课本里贝叶斯)判别函数F1、F2和F3分别为:
F1=+--- PC6-
F2=- + + + PC6-
F3=-+----
(其中 PCI, PC2, PC3, PC4, PC6 为变量)
将样本相应的分别代入3个方程中求得3个函数值,并作比较。哪个函数值最大,则将样 本分类到该组中
文献(4)中建立的Fisher (这里的Fisher就指是课本里贝叶斯)判别函数分别为:
Y1= 25. 563 R 514 - 25. 538 R629 + 10. 591 R650 - 31. 034
Y2= 21. 363 R 514 - 8. 017 R 629 - 5. 404 R 650