1 / 50
文档名称:

生物信息课件6.ppt

格式:ppt   页数:50页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

生物信息课件6.ppt

上传人:所以所以 2012/2/26 文件大小:0 KB

下载得到文件列表

生物信息课件6.ppt

文档介绍

文档介绍:第七章基因芯片数据分析
Microarray Data Analysis
第一节芯片平台及数据库
(General Microarray Platform and Database )
一、cDNA微阵列芯片
寡核苷酸芯片类似于cDNA芯片,但是在探针的设计上优于cDNA芯片,它的探针并不是来源于cDNA克隆,而是预先设计并合成的代表每个基因特异片段的约50mer左右长度的序列,然后将其点样到特定的基质上制备成芯片,从而克服了探针序列太长导致的非特异性交叉杂交和由于探针杂交条件变化巨大导致的数据结果的不可靠。
二、寡核苷酸芯片
五、基因表达仓库
Gene Expression Omnibus,GEO
六、斯坦福微阵列数据库
The Stanford Microarray Database,SMD
第二节基因芯片数据预处理 (General Microarray Data Type and Database )
一、基因芯片数据提取与过滤
(一) cDNA微阵列芯片
(二) Affymetrix公司的原位合成芯片
定性信息提取:P/A/M(Present/Absent/Marginal)
定量信息提取:基于探针集汇总后的基因水平的荧光信号强度值
数据过滤
数据过滤的目的是去除表达水平是负值或很小的数据、或者明显的噪声数据。
过闪耀现象
物理因素导致的信号污染
杂交效能低
点样问题
其它
二、数据补缺
(一)数据缺失类型
非随机缺失
基因表达丰度过高或过低
随机缺失
与基因表达丰度无关,数据
补缺主要针对随机缺失情况
(二)数据补缺方法
1、简单补缺法
missing values = 0 expression
missing values = 1 expression (arbitrary signal)
missing values = row (gene) average
missing values = column (array) average
2、K近邻法
选择与具有缺失值基因的k个邻居基因
用邻居基因的加权平均估计缺失值
参数:
邻居个数
距离函数