1 / 17
文档名称:

基因功能富集分析的研究进展.doc

格式:doc   大小:39KB   页数:17页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因功能富集分析的研究进展.doc

上传人:cengwaifai1314 2019/6/2 文件大小:39 KB

下载得到文件列表

基因功能富集分析的研究进展.doc

文档介绍

文档介绍:基因功能富集分析的研究进展随着高通量测序技术的飞速发展及相关技术的广泛应用,生物医学相关研究领域已进入了大规模组学数据呈指数增长的后基因组时代[1].一方面,这使得生物医学研究得以从单个基因的分析转变为系统水平上的研究,,,研究者通常会对基因功能进行富集分析,期望发现在生物学过程中起关键作用的生物通路,,基因功能的富集分析已成为功能组学数据分析的常规手段,并随着高通量组学数据的发展,如从基因芯片数据到RNA-seq数据的转变,开发出了一系列相应的分析方法,最早开发的过代表分析(over-representationanalysis,ORA)仅针对一组基因,而高通量组学数据的发展使得功能集打分(functionalclassscoring,FCS)应运而生,随着对于生物学通路及复杂网络的深入完善和了解,又相继开发了基于通路拓扑结构(pathwaytopology,PT)worktopology,NT),以方便研究者了解相关领域,(geneset)[2].由这些基因功能集构成的常用基因功能数据库有GO[3],生物学通路,包含生化反应、代谢或信号通路的KEGG[4,5],Reactome[6],Biocarta[7]等,整合数据库,如MsigDB[8],研究者通常会获得一组他们感兴趣的基因,如在疾病和正常组织中有显著差异表达的基因,,研究者可针对这组感兴趣的基因,进行基因功能的富集分析,发现在其中有显著富集的特定生物学通路,,高通量组学技术,如基因表达芯片(microarray)或RNA-seq,,研究者也可以直接针对全基因组基因表达谱信息来进行富集分析,从中鉴定出案例和对照状态下在研究对象中发生显著表达差异的生物通路,,对于基因表达芯片和RNA-seq,,基因芯片记录的是连续的荧光信号强度值,而RNA-seq记录的是RNA序列的读段个数[9],,基于不同的假说和统计方法,,一方面极大地促进了研究者的科研工作进展,,:ORA,FCS,PT,NT的方法(图1).(ORA)方法(1),ORA针对的数据是一组感兴趣的基因(基因列表),,找出其中共同的基因并进行计数(统计值),最后利用统计检验的方式来评估观察的计数值是否显著高于随机,,Fisher精确检验和二项分布检验[45],而其中最为广泛使用的是Fisher精确检验,即利用2×2的列联表,根据超几何分布来检验基因列表中的基因在待测功能集中是否显著富集.(2),包括DAVID,GOstat,Gen-,不仅包含大量不同物种的基因功能注释信息,也涵盖了主流的生物通路注释库如GO条目和KEGG通路,而且还提供了基因名称转换功能,,DAVID已成为目前应用最广泛的ORA分析工具.(3),具有结果稳健、,包括:(