1 / 26
文档名称:

第十章基因芯片微阵列数据库.ppt

格式:ppt   页数:26页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第十章基因芯片微阵列数据库.ppt

上传人:分享精品 2016/1/1 文件大小:0 KB

下载得到文件列表

第十章基因芯片微阵列数据库.ppt

文档介绍

文档介绍:第十章基因芯片微阵列数据库基因芯片是所有生物芯片的佼佼者。其芯片制作技术、数据分析方法及在各种生命科学领域内的应用均遥遥领先于其他类型的生物芯片。第一节常用基因芯片及其数据库一、Affymetrix芯片Affymetrix基因芯片系同类产品的首创,为最受欢迎的基因芯片之一,在生物各领域应用广泛。芯片上的25核苷酸探针通过一种基于光刻合成及组合化学的独特工艺直接在芯片上合成。芯片设计的核心技术是探针对的使用:每一根匹配探针(PM)均有一根相应的错误探针(MM)与其相匹配。两个探针间的唯一区别在于第13个核苷酸。PM的该位置核苷酸可同其靶基因完全互补,MM则相反。这种设计利于对非特异杂交作出修正。每一靶基因都有相应的多组探针对。Concepts of Array DesignPMMMProbe setProbe pairPM to maximize hybridizationMM to ascertain the degree of cross-hybridization每根探针都会有一个相应的基因表达值。但最终每个靶基因的表达值要通过独特的统计学运算才能得到(如Affmetrix的MA55)。对于Affmetrix的芯片,重要的是应懂得设计核心是探针对;每个靶基因都有多组相应的探针对,称探针组。典型的经过MA55处理过的Affymetrix的基因芯片数据包括四项:1、探针组代号。Affymetrix给每个探针组独特代号。一般探针组代号与靶基因一一对应,但有例外。2、表达值。经由MA55处理后得到的探针组表达值,相当于靶基因表达值。3、表达值预测。有三字母分别代表表达值是否真的存在:P代表存在,A代表不存在,M代表介于两者之间。基因表达的存在与否由统计学经分析探针组中每根探针的表达值后决定。4、表达之探测p值。统计学分析探针组每根探针的计算结果,用来决定表达之探测所用的P或A或M。Affmetrix的探针是依据GenBank,RefSeq及dbEST数据库中的DNA序列设计而成,并利用UniGene以及生物信息学中的片段组装技术来获取探针的特异性。大多数探针的序列与DNA正股序列相同(与mRNA序列相同),极少数与DNA副股相同。探针多倾向位于基因的3’端,但探针间有足够的距离以确保探针灵敏度。二、Agilent芯片和其他用于双荧光标记的芯片及其数据分析Agilent的长寡核糖核苷酸芯片是建立在其母公司HP的喷墨打印技术上,把底物直接打印到芯片上特定区域,在芯片上固相合成具有特定核苷酸顺序的探针。探针长度60个核苷酸残基,高于Affymetrix探针,大大提高了探针特异性。每一靶基因通常只选一个探针。Agilent也提供cDNA探针。Agilent等芯片采用双荧光标记法检测和数据分析。双荧光标记杂交技术中,两种不同样品的mRNA被用不同的荧光标记。标记产物与芯片上的DNA探针杂交后,在不同的激发波长和发射波长检测后,通过激光共聚焦荧光扫描检测杂交信号。同一探针上的两种不同荧光信号的相对强度被用于推算相应靶基因在两种不同样品中的相对表达量。两个样品中通常一个是对照样品,一个是待测样品。如果不同的芯片使用相同对照样品,则不同芯片上的待测样品中基因表达的水平也可被比较。双荧光标记芯片数据归一化处理:目的是消除同一芯片上的两种荧光信号在标记、共聚焦扫描和其他实验操作环节引入的系统误差。最简单的方法就是将两种不同荧光信号各探针的平均值或者中间值调整到相同。为进一步消除在不同荧光强度范围内的标记差异的不同,常采用LOWESS方法。经过归一化处理的信号强度被综合而成代表两个样品中各个靶基因表达相对强度的信号比值。第二节基因芯片数据处理与分析所有相关的DNA微阵列数据分析按其目标所分均可归两类:发现和预测。发现:代谢调控中的新基因、潜在的新的药物受体、新的致病基因。预测:建立数学预测模型,用于药物毒性预测及疾病诊断与分类。发现和预测均需经过相同的基本分析途径:有统计意义的差异表达基因的筛选。