文档介绍:第一章基因组测序与序列组装
任科教师: 余爱丽
生命科学院分子生物学与生物信息学系
主要内容:
什么是基因组
什么是基因
DNA测序的方法
DNA序列的组装
人类基因组计划
水稻基因组计划
后基因组学
1. 什么是基因组
基因组就是一个物种中所有基因的整体组成。
基因组有两层意义:遗传物质和遗传信息。
要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。
Zea mays 8,000
Homo sapiens 3,000
Oryza sativa 400
Drosophila melanogaster 165
Arabidopsis thaliana 100
haromyces cerevisiae 12
Genome Size (Mb)
什么是C 值?
通常是指一种生物单倍体基因组DNA的总量.
在真核生物中,C值一般随着生物的进化而增加,高等生物C值一般大于低等生物。
C值悖理:
生物的复杂性与基因组的大小并不完全成比例增加
细菌
真菌
等
动物
阴影部分为一个门内C-值的范围
重复顺序
高度重复顺序:
长度:几个——几千个bp
拷贝数:几百个——上百万个
首尾相连,串联排列
集中分布于染色体的特定区段(如端粒,着丝粒等)
也称卫星DNA
中度重复顺序:
一般分散于整个基因组中; 长度和拷贝数差别很大
单一顺序:
基因主要位于单一顺序
动物中单一顺序约占50%
植物中单一顺序约占20%
DNA 的复性遵循二级反应动力学,可表述为:
dCt / dt = -KC02
反应达 t 时,单链DNA浓度= Ct
C0 = 单链 DNA起始浓度
K= 复性速度常数
顺序复杂性
Cot(1/2) = 1/K (mol. Sec / L) 常数
Ct/C0
0
1
0
1
C0t(1/2) C0t(1/2)
C0t(1/2)值与基因组复杂性成正比。
是遗传信息的物理和功能单位,包含产生一条多肽链或功能RNA所必需的全部核苷酸序列。
基因分类:
编码RNA的基因,如rRNA基因,snRNA基因等;
编码蛋白质的基因
2. 什么是基因?