文档介绍:主要内容
第一节基因序列结构的生物信息学检索和比对
分析
第二节基因转录起始点的鉴定
第三节启动子的结构及功能分析
第四节编码序列结构分析
第一节
基因序列结构的生物信息学
检索和比对分析
基因或DNA序列比对
°就是在数据库中对基因序列或DNA序列进行
比对分析,以其能够推测出其结构、功能及在
进化上的联系
直接的数量关系
比对方法
序列比对目的
判断两个或多个序列间是
否具有足够的相似性
从而判断二者之间是否具
有同源性
进化上曾具有共同祖先
序列比对的结果
取代
保守序列:
插入
°可能是共同进化的标志
缺失
缺失?
可能并不代表功能的重要性
Mouse:
GGKDSCQGDSGGPVVCNG----QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAAN
Crayfish
GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV-
保守序列插入?·当两个序列非常相似时,是否一定
说明它们具有相似的功能?
NCBI数据库
NCBI首先创建 Gen Bank数据库
于1991年开发了 Entrez数据库检索系统,该系统整合了
GenBank、EMBL、PIR和 SWISS-PROT等数据库的序列信息
以及 MEDLINE有关序列的文献信息,并通过相关链接,将他
们有机地结合在一起
. NCBI还提供了其他数据库,包括在线人类孟德尔遗传
ωOMIM)、三维蛋白结构的分子模型数据库(MMDB)、人
类基因序列集成( Unigene)、人类基因组基因图谱
(GMHG)、生物门类( Toxonomy)等数据库
NCBI GenBank Overview
Entrez BLAST OMIM
Books
NCBINCBI Web Site
is GenBank?
CoreNucleotid
e are approximately 106, 533. 156. 75
n 108431, 692 sequence records in the
Gen Bank divisions and 148, 165, 117, 763 bases in 48443, 067 sequence records in
wGs division as of August 2009
which composes the DNA Dat
pean Molecular Biology Laboratory(EMBL), and GenBank at NCBI. These three
izations exchange data on a daily basis
xample of a GenBank record may be viewed for a Saccharomyces cerevisiae gene
e News: 2009 H1N1 Flu Virus(Swine Flu
LocusLink
NUM Catalog
sed through the NCBI Elu Resource
MINCBI 2009 H1N1 Flu Resources:
lugo
(1) Nucleotide
该数据库由国际核苷酸序列数据库成员美国
国立卫生研究院 Gen Bank、日本DNA数据库
①DDBJ和英国 Hinxton hall的欧洲分子生物学
实验室数据库(EMBL)三部分数据组成
三个组织每天交换各自数据库中的新增序列
实现数据共享
(2) Genome
即基因组数据库,提供了多种基因组、完全染
色体、重叠序列图谱以及一体化基因物理图谱
(3) Structures
即结构数据库或称分子模型数据库(MMDB),
包含来自X线晶体学和三维结构的实验数据
NcB已经将结构数据交叉链接到书目信息、序列数据库和
NcB的 Taxonomy中运用NcB的3D结构浏览器和cn3D,可
以很容易地从 Entrez获得分子的分子结构间相互作用的图像
(4) Taxonomy
即生物学门类数据库,可以按生物学门类进行检
索或浏览其核苷酸序列、蛋白质序列、结构等
(5)PosEt
包含研究一个人群、一个种系发生或描述人群
变化的一组组联合序列
PosEt既包含了核酸序列数据又包含了蛋白质
序列数据
(7)文献数据库
PubMed:生物医药科学的检索系统
OMIM:孟德尔遗传学数据库是人类