1 / 35
文档名称:

logistic回归快速多因子降维算法.pdf

格式:pdf   页数:35页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

logistic回归快速多因子降维算法.pdf

上传人:静雨蓝梦 2015/10/21 文件大小:0 KB

下载得到文件列表

logistic回归快速多因子降维算法.pdf

文档介绍

文档介绍::篜:.琇瓸:
侯堤签字日期:迎:臣:中国科学技术大学学位论文原创性声明中国科学技术大学学位论文授权使用声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。作者签名:导师签名:签字日期:
摘要基因。这个问题的困难之处一部分来源于传统的参数统计方法对于高维数据的处理效果不佳。,然而最初提出穷举分组法的计算时间复杂度随着基因位点数目增加的急剧增长而使得计算不可行。而大大提高了算法的效率。最后通过理论分析和数据模拟实验,验证了算法的关键词:关联分析,多因子降维,快速算法,回归当代人类基因工程中最大的挑战之一就是定位和识别导致常见疾病的可疑本文首先叙述了多因子降维方法的产生背景,分析并提出了采用带头O畹腖毓槿范ㄖ虏』蚋鍪缓笤俨捎枚嘁蜃咏滴惴ǎ有效性。
..琱,,.瓼,琇甌:琭
目录⋯⋯.⋯....⋯⋯⋯.⋯⋯⋯⋯..⋯.⋯...⋯⋯.目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯.⋯.....嘁蜃咏滴椒ㄑ芯拷梗多因子降维方法详述.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..,惴ǖ牟街瑁.〗⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.维算法综述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯模拟数据实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.萆煞椒ā摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯..论文研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯多因子降维方法概述⋯,⋯.⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯....嘁蜃咏滴幕舅枷搿论文的主要内容与结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯·⋯··.第二章通过带带头O畹膌毓槿范ǚ掷啾淞扛鍪亩嘁蜃咏
.D馐菁扑憬峁谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...惴ㄐ时冉稀第四章总结与展望⋯..⋯⋯⋯⋯..⋯⋯⋯.⋯.本文的主要工作⋯.⋯⋯....⋯.⋯.⋯.⋯..研究的不足及展望⋯⋯⋯......⋯...⋯.⋯.参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.在读期间发表的学术论文与取得的研究成果⋯⋯⋯⋯.致Ⅵ目录●■,
第一章绪论论文研究背景多因子降维方法概述随着生物技术的进步,人类基因测序工程的完成,人类有了越来越多的途径来解读构建身体的密码。当今生物工程的发展,尤其是合成生物学的发展,生物学家已经可以像设计电子芯片那样设计蛄胁饬啃酒哪承┗因的表达方式,增加或删除某些功能。与此同时,人们一直致力于寻找致病基因,有不少疾病,如糖尿病,高血压,抑郁症,节段性肠炎等都被确定是与特定基因有关的。如果能有效的定位这些基因位点,我们就能够达到在基因层面上对疾病的诊断。目前的测序技术,已经从以前单个位点的测量发展到多个位点的测量,一次可测量的单核苷酸可多达数十万个,从而大大提高了寻找致病基因的效率。因为很多常见的疾病被发现是与特定基因的组合有关,因而对于基因交互作用的研究有了越来越多的需要。这使得在数据分析上出现了新的挑战,由于测量位点数远远大于被测病患的样本数,如果用传统的回归分析、回归以及方差分析的方法来研究基因之间的交互作用功效较低。由此诞生了很多新的方法,多因子降维法就是其中非常有效的一种。.嘁蜃咏滴幕舅枷当代人类基因工程中最大的挑战之一就是定位和识别导致常见疾病的可疑基因。这个问题的困难之处一部分来源于传统的参数统计方法对于高维数据的处理效果不佳。比如用回归分析基因的高阶交互效应,由于数据的高维度和稀疏性,在由基因型和是否患病分别作为行和列的列联表中,将会有很多空格,这将会使得估计出的回归方程系数具有非常大的方差。一个解决方案就是搜集第一章绪论
毪更大的数据以保证估计的稳健性,然后如此海量的数据搜集往往费时费力。另一个解决方案就是发展新在小样本上也能获得较好功效的统计方法。多因子降维法就是一种在小样本上也能获得较好功效的分析基因一基下面我们以两位点情形为例对多位点分析的困难和多因子降维方法进行简要介绍。我们分别用琣,琤代表等位基因上不同的基因型,在病例对照试验中,假设我们可以得到如下结构的数据。是否患病可以看