1 / 54
文档名称:

基因微阵列缺失点估计方法研究.pdf

格式:pdf   大小:1,773KB   页数:54页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因微阵列缺失点估计方法研究.pdf

上传人:陈潇睡不醒 2021/11/7 文件大小:1.73 MB

下载得到文件列表

基因微阵列缺失点估计方法研究.pdf

相关文档

文档介绍

文档介绍:Classification code: TP399 University code: 10712
UDC: Postgraduatenumber:2010051665
Confidentiality level: Open







Thesis for Master’s Degree
Northwest A&F University in2013



GENEMICROARRAY MISSING VALUE ESTIMATION
TECHNOLOGY




Major:Computer Application Technology
Research field:Intelligent System
Name of Postgraduate:Meng Fan-chi
Adviser:Professor Li Shu-qin
Date of submission:May,2013






Yangling ShaanxiChina
 
 

1
基因微阵列缺失点估计方法研究

摘要

基因微阵列技术在各种生物实验中已经得到了广泛的应用,是生物信息学中一项重
要的研究分支。基因微阵列实质是大规模的矩阵,但由于受到实验条件的限制,这些矩
阵往往都存在缺失点,所以如何对这些缺失点进行估计,是当前生物信息学领域研究的
一个热点。针对现有基因微阵列估计方法只利用了数据的单一特征(全局的同质性或局
部的异质性)的缺点,论文以局部最小二乘法和贝叶斯主元分析法为基础,考察了稀疏
表示在基因微阵列缺失点估计中的性能,提出了三种新的估计方法,并提出了估计方法
的自适应选择模型。主要研究内容和结论如下:
(1)在局部最小二乘法的框架下考察了稀疏表示的估计性能。通过对基因微阵列
数据求奇异值分解,来分析数据的低秩特性。结果表明基因微阵列数据的低秩特性达不
到稀疏表示的要求,所以不适合使用稀疏表示来估计。
(2)通过使用非精确增广拉格朗日乘子法解决矩阵填充问题,得到完整的矩阵。
该完整矩阵可替代局部最小二乘法中的行均值填充矩阵。使用此方法,可充分利用矩阵
的全局相关性和局部相似性,相比贝叶斯主元分析法和局部最小二乘法可获得更低的估
计错误率。
(3)在目标基因的 K 最近邻形成的邻域上进行贝叶斯主元分析的操作。该方法可
避免传统贝叶斯主元分析法在局部相似性较高的数据上表现不佳的缺点,在不同类型的
基因微阵列数据集(时间序列、非时间序列和混合序列)上均可获得较低的估计错误率。
(4)将与缺失点相关性最强的基因(行)和观测(列)选出来形成一个双边类,
在双边类上进行贝叶斯主元分析。该方法在缺失率较高的数据集上具有明显优势,但是
计算复杂度较高,耗时较长。
(5)通过使用不同方法估计模拟缺失矩阵中的缺失点,提出了估计方法的自适应
选择模型。验证结果表明该模型可选择出估计错误率最低的方法,有效辅助真实情况下
各方法的选择。

关键词:基因微阵列缺失点;稀疏表示;贝叶斯估计;最小二乘法;双边类




2