1 / 14
文档名称:

微阵列第8次课.ppt

格式:ppt   大小:749KB   页数:14页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

微阵列第8次课.ppt

上传人:sxlw2017 2018/3/12 文件大小:749 KB

下载得到文件列表

微阵列第8次课.ppt

相关文档

文档介绍

文档介绍:第八章基因芯片探针校正
黄仲曦
基础医学院肿瘤研究所
《微阵列设计与分析》
为什么要校正
Affymetrix公司HG-U133及以前的型号设计于2001年以前;当时人类基因组测序只完成25%。这些芯片的探针许多现在被发现是非特异的,必须放弃。
尽管Affymetrix公司对探针集注释信息每季度更新一次,仍无法改变许多探针集中的某些探针已经指向其它的基因甚至多个基因。
基因芯片存在多个探针集指向同一个基因的问题。还没有标准的办法来处理这类问题。最直接的办法是将它们融合在一起,实现一个基因(转录本)对应一个探针集。
如何校正-产生CDF文件
所有探针与最新的Unigene序列和基因组序列进行比对。
产生Unigene CDF文件(Affymetrix原始设计)
探针必须同时与cDNA/EST和基因组序列完全匹配;
探针必须只与唯一的Unigene和唯一的基因组序列匹配;
指向同一基因的所有探针必须按顺序排列在基因组区域的同一方向上;
每个探针集必须至少包含3个探针而且定位在不同的位置。
产生参考序列、Entrez 基因和外显子、ENSEMBL基因、转录本和外显子以及 VEGA基因、转录本和外显子的CDF文件
一个探针必须只与唯一的基因组序列匹配;
匹配到同一靶序列而且方向相同的探针组成一个新的探针集;
每个探针集必须至少包含3个探针而且定位在不同的位置。
#v12
Custom CDF
注释
ENTREZG
Entrez 基因
UG
Unigene
ENSG
Ensembl 基因
VEGAG
VEGA基因
ENSE
Ensembl 外显子
VEGAE
VEGA外显子
ENST
Ensembl 转录本
VEGAT
VEGA转录本
REFSEQ
参考序列
TAIRT
瓦片芯片转录本
TAIRG
瓦片芯片基因
MIRBASEG
MicroRNA基因
MIRBASEF
MicroRNA基因家族
探针校正的缺陷
探针校正以后,探针集所含的探针从3个到几十个不等,使得不同探针集的误差变化很大。
对于Unigene CDF文件来说,会丢掉一些好的探针。它们由于嵌合克隆或基因同源而存在于多个基因。
对于ENSEMBL外显子CDF文件来说,在外显子定义上仍然有许多重叠和冗余。
对于ENSEMBL转录本CDF文件来说,仍然有许多已知的转录本没有被包含。
探针校正所产生的影响
以Hs_U133A的CDF文件校正为Hs_U133A_UG167为例:
大约有4000个基因的多个探针集被融合为单个探针集。因此,基因表达的测量误差也随之降低。
如果一个探针集只剩下3-5个探针的话,测量误差将增大2-3倍。大约有900个基因受此影响,并且表达值与原来相比变化25%以上。
总的来说,在一个包含14个脑样品的测量实验中,大约20%-30%基因的表达值在校正前后发生改变。
怎样使用校正后的CDF文件
RMAExpress、MAS5和dChip可以直接使用,但是dChip要将名字改回Affymetrix原来的命名。
BioConductor使用(略)
用Ensembl数据库获取基因注释:
./group/customcdf/
参考文献
Dai M, Wang P, Boyd AD, Kostov G, Athey B, Jones EG, Bunney WE, Myers RM, Speed TP, Akil H, Watson SJ, Meng F. Evolving Gene/Transcript Definitions Significantly Alter the Interpretation of GeneChip Data. Nucleic Acid Research. 2005, 33 (20), e175