1 / 9
文档名称:

一种有效的DNA微阵列数据特征基因提取方法.doc

格式:doc   大小:64KB   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种有效的DNA微阵列数据特征基因提取方法.doc

上传人:sssmppp 2020/8/24 文件大小:64 KB

下载得到文件列表

一种有效的DNA微阵列数据特征基因提取方法.doc

文档介绍

文档介绍:一种有效的DNA微阵列数据特征基因提取方法摘要:对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因。提出一种新的特征基因选择方法(ReliefF_DE),选取了4个公共微阵列基因数据集进行仿真实验,实验结果表明该方法可以在较少的特征基因下取得较高精度,且所选的特征基因与癌症密切相关,进一步验证了方法的可行性和有效性。关键词:DNA微阵列;支持向量机;特征基因;特征选取中图分类号:?34;TP18文献标识码:A文章编号:10047373X(2014)13?0095?04MethodofeffectiveDNAmicroarraydatafeatureextractionWEIJun(puterScience,ShaanxiUniversityofTechnology,Hanzhong723000,China)Abstract:Asforcancerclassification,(ReliefF_DE)ispresentedinthispaper・FourpublicmicroarraygenedatasetswereselectedtocarryontheSimulationexperiment・uracyinthecaseofafewfeaturegenes,andtheselectedfeaturegenesarecloselyrelatedtocancers・:DNAmicroarray;supportvectormachine;featuregene;featureextraction0引言微阵列数据[1]广泛而成功地应用于生物医学的癌症分类研究。一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因和相对较少(往往少于一百)的样本。在这成千上万的基因中,只有一小部分基因有助于癌症分类。因此,对于癌症的分类,如何找到对于样本分类来说起决定性作用的一组基因作为样本的分类特征基因,是建立一个有效分类模型的关键所在,同时也是发现肿瘤分类与分型的基因标记物及药物治疗潜在靶点的重要手段。鉴于特征基因的选取在肿瘤分类中的重要作用,研究者们针对该问题提出了大量研究方案[2?6]。本文在分析肿瘤基因表达谱特征的基础上,提出了基于ReliefF_DE的基因特征选择方法。首先采用ReliefF算法计算每个基因与分类属性的相关性,并进行降序排列,取[N]个关联性较大的基因作为候选基因子集;再使用差分进化算法对候选基因子集进行特征基因选择。本文选取了4个公共微阵列基因数据集进行仿真实验,实验结果表明,本文算法不仅可以在特征属性的选择上剔除了大量的冗余属性,而且分类精度有较大的提高。1ReliefF算法1992年Kira和Rendell首先提出Relief算法[7],算法首先对随机选择的[m]个样本的假设间隔进行计算,然后将计算结果累加起来作为属性的权值,最后根据属性权值的大小就可以近似地估计出对于分类