1 / 8
文档名称:

基因表达谱芯片的数据分析.doc

格式:doc   大小:34KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因表达谱芯片的数据分析.doc

上传人:zhongxinado 2020/8/4 文件大小:34 KB

下载得到文件列表

基因表达谱芯片的数据分析.doc

文档介绍

文档介绍:基因表达谱芯片的数据分析 吴斌,沈自尹,复旦大学华山医院中西医结合研究所上海市200040国家自然科学基金资助项目,:沈自尹,200040,:-6311收稿日期:2005-09-10接受日期:2005-12-02摘要基因芯片数据分析的目的就是从看似杂乱无序的数据中找出它固有的规律,本文根据数据分析的目的,从差异基因表达分析、聚类分析、判别分析以及其它分析等角度对芯片数据分析进行综述,并对每一种方法的优缺点进行评述,:基因芯片;数据分析;差异基因表达;聚类分析;判别分析吴斌,;14(1):68-740引言基因芯片数据分析就是对从基因芯片高密度杂交点阵图中提取的杂交点荧光强度信号进行的定量分析,通过有效数据的筛选和相关基因表达谱的聚类,最终整合杂交点的生物学信息,,如何解读芯片上成千上万个基因点的杂交信息,将无机的信息数据与有机的生命活动联系起来,阐释生命特征和规律以及基因的功能,是生物信息学研究的重要课题[1].基因芯片的数据分析方法从机器学****的角度可分为监督分析和非监督分析,假如分类还没有形成,非监督分析和聚类方法是恰当的分析方法;假如分类已经存在,则监督分析和判别方法就比非监督分析和聚类方法更有效率。根据研究目的的不同[2,3],我们对基因芯片数据分析方法分类如下:(1)差异基因表达分析:基因芯片可用于监测基因在不同组织样品中的表达差异,例如在正常细胞和肿瘤细胞中;(2)聚类分析:分析基因或样本之间的相互关系,使用的统计方法主要是聚类分析;(3)判别分析:以某些在不同样品中表达差异显著的基因作为模版,(differenceexpression,DE)对于使用参照实验设计进行的重复实验,可以对2样本的基因表达数据进行差异基因表达分析,具体方法包括倍数分析、t检验、(foldchange,FC)倍数分析是最早应用于基因芯片数据分析的方法[4],该方法是通过对基因芯片的ratio值从大到小排序,ratio是cy3/cy5的比值,又称R/-,,此阈值范围会根据可信区间应有所调整[5,6].处理后得到的信息再根据不同要求以各种形式输出,如柱形图、饼形图、,节约研究成本;缺点是结论过于简单,很难发现更高层次功能的线索;除了有非常显著的倍数变化的基因外,其它变化小的基因的可靠性就值得怀疑了;这种方法对于预实验或实验初筛是可行的[7].此外倍数取值是任意的,而且可能是不恰当的,例如,假如以2倍为标准筛选差异表达基因,有可能没有1条入选,结果敏感性为0,同样也可能出现很多差异表达基因,结果使人认为倍数筛选法是在盲目的推测[8,9].(t-test)差异基因表达分析的另一种方法是t检验[10],当t超过根据可信度选择的标准时,,由于基因