文档介绍:。孔薇(上海海事大学信息工程学院,上海201306)摘要:构造高精度分类模型是对基因表:逛谱数据分析的主要研究方向之一,但提取不同特征空间产生的分类效果有很大差异,而集成分类系统在一定程度上提高了分类结果的可靠性和稳定性。构建基于PCA和NMF集成分量系统,并基于分析混合矩阵A的hinton图生物学意义建立集成独立分量选择系统,成功运用到基因表达谱分析,。关键词:微阵列数据;NMF;ICA;集成分类中图分类号:Q789;:A文章编号:1674—6236(2012)07—0009—ponentSONGHong—sheng,KONGWei(InformationEn#needngcollegeofShanghaiMaritimeUnwe~i@,Shanghai201306,China)Abstract:Oneofthemainresearchdirectionbasedongoneexpressionmicroarraydataisconstructhigh--,,[Ilisbe~:microarraydata;Non-gegativeMatrixFactorization(NMF);ponentAnalysis(ICA);ensembleclassificatiOn自Golub等于1999年开创了基于基因表达谱的肿瘤分类领域以来。研究者已经提出许多基于基因表达谱的分类方法,这一领域也迅速成为生物信息学的主要研究方向之一,如,人工神经网络(work,ANN)、贝叶斯(Bayesian)、决策树(DecisionTree)和支持向量机机(SupportingVectorMachine,SVM)等经典的分类器。由于微阵列数据集高维、小样本和高噪声等特点,,随着提取特征基因的不同。实验结果会有很大差别。因此,为了提高分类模型的分类性能、稳定性以及泛化能力,研究人员把很多分类器集成起来,并采用某种决策策略对多个分类器的分类结果进行判定以