1 / 69
文档名称:

多视图矩阵分解的聚类分析.pdf

格式:pdf   大小:2,418KB   页数:69页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多视图矩阵分解的聚类分析.pdf

上传人:zhufutaobao 2021/11/24 文件大小:2.36 MB

下载得到文件列表

多视图矩阵分解的聚类分析.pdf

文档介绍

文档介绍:硕 士 学 位 论 文


多视图矩阵分解的聚类分析
Clustering Analysis on Multi-view Matrix Factorization










作 者 姓 名: 张 祎
学科、 专业: 信息与通信工程学院
学 号: 21509096
指 导 教 师: 孔祥维
完 成 日 期:



大连理工大学
Dalian University of Technology
大连理工大学硕士学位论文
摘 要
随着多媒体技术的飞速发展,人们可获得的信息越来越多,而这些信息中既包含大
量的无用信息,又存在很多的“看不见”的有用信息。因此,利用流行的机器学****和人
工智能等手段,对信息进行提取、挖掘和分析显得尤为重要。
聚类分析是一种无监督学****方法,它可以在没有任何先验知识的条件下,对数据集
进行聚类,使得类别内样本尽可能相似,类别间样本差异尽可能大。因此,作为一种数
据挖掘的重要手段,聚类分析可以揭露出样本间的从属关系,从而在模式识别、人工智
能等领域有着极为重要的意义。
多视图聚类分析因其利用多个不同视图特征的信息,可以更加全面地描述数据库,
从而获得比单视图聚类更好的聚类性能。传统的多视图聚类算法只考虑不同视图间的一
致性,而忽略了同一个视图内部不同样本在特征学****前后也应保持相同的相似程度。因
此,本文将局部空间结构约束引入传统的多视图学****框架,提出了一种多视图聚类算法
——MLN。但是,MLN 算法是基于 NMF 矩阵分解的,该方法只适用于非负的特征矩
阵。而现实场景中,很多数据的特征难免存在负数,因此本文又提出了基于 SemiNMF
矩阵分解的多视图聚类算法 MLSN。无论特征数据矩阵是否存在负数,MLSN 都有较好
的聚类性能。在三个公开的数据库上进行实验,结果证实 MLN 和 MLSN 算法都有着较
好的聚类性能。
线索集聚聚类作为一种集成聚类方法,可以通过结合策略将一组不同的基聚类器进
行集成,从而提高聚类的泛化能力,获得更高的聚类准确率。线索集聚聚类主要分为构
建共联矩阵和对其进行凝聚型层次聚类两个步骤。然而,传统的加权线索集聚聚类方法
仅考虑基聚类器的影响,或者仅考虑团簇质量的影响,而实际上二者都会影响样本间的
相关性。因此,本文提出一种新的加权线索集聚聚类方法——GLWEA。该方法在构建
共联矩阵时,将基聚类器质量和团簇质量都作为影响权重系数的因子,进而再使用凝聚
型层次聚类得到最后聚类结果的集成聚类方法。实验结果表明了该算法的有效性。
结合集成聚类的多视图聚类,可以利用集成聚类的优势来降低参数对多视图聚类的
影响,从而提高聚类性能。因此,本文将两种线索集聚聚类方法 LWEA 算法和 GLWEA
算法与多视图聚类算法 MLSN 相结合,得到了两种多视图矩阵分解的集成聚类方法——
LEMGSN 和 GLEMGSN。实验结果证实该算法相较于 MLSN 有所提高。