文档介绍:第 27卷第 6期计算机应用与软件 Vol
2010年 puterApplicationsandSoftware
流形学习算法中的参数选择问题研究
王泽杰胡浩民
(上海工程技术大学计算中心上海 201620)
摘要流形学习(ManifoldLearning)算法是近年来发展起来的非线性降维机器学习算法。等度规特征映射 Isomap(Isometric
featuremapping)和局部线性嵌入 LLE(LocallyLinearEmbedding)是两种典型的流形学习算法。通过实验比较和分析两种算法中邻
接参数 K和采样点数 N的选取对降维结果以及执行时间的影响,实验结果表明 Isomap对邻接参数 K和采样点数 N具有较高的容
忍度,而 LLE算法在计算速度上优势明显。
关键词等度规特征映射局部线性嵌入流形学习非线性降维
ONPARAMETERSELECTIONINMANIFOLDLEARNINGALGORITHM
WangZejie HuHaomin
(ComputingCenter,ShanghaiUniversityofEngineeringScience,Shanghai201620,China)
Abstract
featuremapping(Isomap)andlocallinearembedding(LLE)parisonandanalysisofthe
putationaleffi
pointsnumberNthanLLE,putationalspeed.
Keywords Isometricfeaturemapping Locallinearembedding Mainfoldlearning Nonlineardimensionalityreduction
求保持数据内在几何特性,对于流形上所有的点,Isomap用它们
0 引言之间的测地线距离代替欧式距离。这是因为对于含有高度非线
性信息的数据点集,数据点之间的欧式距离有时并不能反映出
流形学习算法是近年来发展起来的一类机器学习算法,文对应流形的内在结构。如图 1A所示,图中的数据点集位于一
献[1]提出的等度规特征映射(Isomap)算法以及文献[2,3]提个潜在的二维流形上,图中两个画圈的点之间的欧式距离(虚
出的局部线性嵌入(LLE)算法引领了该领域快速地发展。流形线表示)并不能反映它们在流形上的相对位置信息,Isomap算
的定义是:设 M是一个 Hausdorff拓扑空间,若对每一点都有 p 法就用这两点在流形表面的测地线距离来表示这种位置信息,
∈M,都有 p的一个开邻域 U和 Rn的一个开子集同胚