1 / 55
文档名称:

基因组序列组装理论与方法简介.pptx

格式:pptx   大小:2,887KB   页数:55页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因组序列组装理论与方法简介.pptx

上传人:wz_198613 2021/3/5 文件大小:2.82 MB

下载得到文件列表

基因组序列组装理论与方法简介.pptx

文档介绍

文档介绍:两种测序策略
分级鸟枪法(BAC TO BAC)
基因组DNA 切成大片段 构建BAC文库
挑选 构建小片段shotgun文库 测序
组装BAC序列 组装基因组序列
全基因组鸟枪法
基因组DNA 构建不同长度shotgun文库 测序 组装基因组序列
基因组测序与组装示意图
基于BAC方法的 优缺点
优点:组装被局限在BAC的范围内,受重复序列影响小,对计算能力要求不高;
缺点:需要大量前期生物学研究工作,效率低,成本高。
全基因组鸟枪法优缺点
优点:不需要生物学前期准备,速度快,成本低;
缺点:组装是在全基因组范围内进行,数据量大,易产生错拼;对计算机软硬件要求均高。
对拼接软件的要求
能充分利用正反向测序的配对信息, 避免重复序列造成的错误拼接
能处理数以百万甚至千万计的数据
程序并行化
高效率比对
能够采用全基因组鸟枪法的关键技术进步:
毛细管测序仪的普遍使用
计算机能力的迅速提高
Hierarchical Shotgun (HS)
Whole Genome Shotgun (WGS)
… the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the methods described in this issue.
Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001)
Shotgun法序列拼接
Consensus
Sequence
Gap
Low Base
Quality
Single
Stranded
Region
Mis-Assembly
(Inverted)
术语
鸟枪法测序数据的组装
鸟枪法文库:目标基因组一定长度随机片段克隆的集合。
正反向测序对: 从同一个克隆片段两端分别测序所得到的一对序列。.
插入片段长度: 克隆载体中插入的外源DN***段长度。
片段连接群(contig):用识别互相重叠的方法对测序数据进行拼接的结果。.
Scaffold: 用正反向测序对连接的非重叠片段连接群。
LW-洞:由于没有测序数据覆盖而在组装结果中留下的洞。
重复序列分析
覆盖度: 基因组被测序数据覆盖的次数。
重复数: 一段DNA序列在基因组中出现的次数。
深度:一段DNA序列在鸟枪法测序数据集中出现次数。例如一个转座子在基因组中出现N次,测序数据集的覆盖度为C, 则这个转座子的平均深度为NC。
20-mer 重复序列:任何深度超过为该数据集确定的重复序列标准的20-bpDN***段。是数学定义的重复序列。
重复序列洞: 由于屏蔽重复序列而在组装结果中留下的洞。