1 / 16
文档名称:

放屁.ppt

格式:ppt   页数:16页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

放屁.ppt

上传人:gyzhluyin 2016/5/30 文件大小:0 KB

下载得到文件列表

放屁.ppt

相关文档

文档介绍

文档介绍:}:学位论文摘要摘要主成分分析(ponent Analysis)是一种用于特征提取和降维的线性方法,它一般使用具有较大方差的维作为主成分而忽略方差小的维,从而将数据映射到低维的子空问中提取线性特征。但是当数据是线性不可分的情况下,该方法不能很好地提取判别特征,通常使用核方法把数据映射到高维特征空问进行主成分的运算,即核主成分分析(Kernel ponent Analysis),该过程不需要显式地知道映射函数,而是利用核技巧实现,提取的非线性特征被成功应用于图像处理等任务中。在核主成分计算过程中,需要储存全部数据集生成的核矩阵,该矩阵是通过核函数计算数据之间的内积而得到的,矩阵的大小随着数据集样本数目朋变化而变化,空间复杂度为O(m2),而对核矩阵进行特征分解的时间复杂度为 O(m3)。在大规模数据集的情况下,由于内存容量的限制,在一般计算机上对核矩阵的存储和计算都是困难的,应寻找可行的解决方法。在深入研究模式分析中核方法相关技术的基础上,本文针对大规模数据集问题,探讨了已有解决方法的实质以及相互之间的关系,提出了三种有效的求解核主成分的方法,具体内容包括: ·plete Cholesky分解将核矩阵转化为两个互为转置的三角矩阵, 三角矩阵的每一列可以看作为特征空间特殊的“输入样本’’,将这些样本输入到主成分分析的迭代算法中,经过若干次迭代后,就可以计算出核主成分。该方法不需要对核矩阵进行特征分解,其空间和时间复杂度分别为O(nm)和 O(nm)+O(nkp),其中Fl,k,m,P分别为核矩阵的秩、需提取的主成分数、样本数以及迭代次数。在大规模数据集的情况下,核矩阵的秩和要提取的主成分数通常远小于样本数,因此空间和时间复杂度都有较大程度的降低。·利用核矩阵的对称性质,基于初始核矩阵创建一个新的Gram-power矩阵, 因为新矩阵和原核矩阵具有相同的特征向量,可以计算Gram-Power矩阵的特征向量来代替核矩阵的特征分解,把核矩阵的每一列看成是迭代主成分分析算法的“输入样本",经过若干次迭代后,可以很容易的求出核主成分, 复日大学博卜学位论文摘要并且算法的空间复杂度从O(m2)减少到O(朋)。提出了一个基于矩阵的核主成分分析(Matrix—based Kernel ponent Analysis)方法,该方法首先将大规模数据集等分成许多小的数据子集,每个数据子集的白相关矩阵可以看成是核空间的“特殊样本",用一个基于矩阵的创新核函数来计算数据子集之间的内积。由于子集的数量远小于数据集样本的数目,因此较大程度地降低核矩阵的大小,提出的方法和 KPCA的实现过程几乎完全一样,并且自相关矩阵含有每个子集的高阶统计信息,有助于性能的改善。通过在人工合成的数据集以及真实的数据上进行实验,验证了大规模数据集的情况下所提出算法的有效性。关键词: 大规模数据集,核主成分分析,核方法,核矩阵,非线性特征,矩阵分解,迭代算法,数据子集 2 复[j大学博:l:学位论文 ABSTRACT ABSTRACT ponent Analysis(PCA)is aclassicaltechnique forfeature extraction and dimension uses thedimension with thelargest variances and neglects ponents,which maps thesample vectors intothelow dimensional itdoes not work well when data the ideaofkernel approach,Kernel ponent Analysis(KPCA)has been generalized totreat with thenonlinear ideais tomap thedatasetfrom theinput space into high-dimensional(even infinitedimensional)feature ,the ponents Callbe extracted using linearalgorithm inthemapping feature extracted thenonlinear feature can plex processing, practice,themapping function isneithercalculated nor keptexplicitly, butre