1 / 11
文档名称:

E__wcb_生物信息学(中译本)_第二章 GenBank序列.pdf

格式:pdf   页数:11
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

E__wcb_生物信息学(中译本)_第二章 GenBank序列.pdf

上传人:中国课件站 2011/12/4 文件大小:0 KB

下载得到文件列表

E__wcb_生物信息学(中译本)_第二章 GenBank序列.pdf

文档介绍

文档介绍:
GonBanlF利数探库

第二章GnBank序列数据库
简介
一级蛰质利核峻数槲在分子儿物学界是红此的司宏见惯,以教于我们修尔会去考庞这怡
智遂存代的工具是如何建立的。但是如果我f【够了孵恩应列是如何汇集刹起
有助于我们砂深对生物学皋理解,并吟能郎曰加兆分地发掀这些记录中留藏的信
Genpanic是美国国立卫生研究院维护的基国序列数探集并注释了所有公
代表了个单独的、连组的、帷有法租的D叉。
系坑发仆学则分,男外此则汝删仆成这些序则数据的技术方法划
。白于最初作者合D创敦据库的真接提交。这些作者封
序列数据作为论文的孤分发表,或将数据直挂仁开。GnBank申位于马里兰州Bethesda的
粉国国立卫生研究院下属国立E,与日本D据库a以及欣洁4
物信息研究院的欧洲分孔生物5超,郭是国际核英蚩序列数
据库合作的成员、所有这三个中心从独邝地侵受数椒捉又而三个中心之间败迷日交换
信息,干制作相同的兆分详细的数据库名仁众开放蛇然格式上有细微的荃别,并明所借用
前信贿也畦有不同.
GenBank数描库是如何构成的,它如何与蛎白质政揪库相衡掳,以及如何解释其中
的数拥陂分关于序列数据库,前人已经作大春的工作,具体可参见Schaleret。吴
1996BairechandApseiller1997iBensoneta1997Gcorgeet.
Stoesseret引,1997iMatemeetal,1997。所有这些论文都指出了数据库仿通墟长
的超骈,千对如何刑用这些生物学资源提出了建议。出究的考虚,以及由于历命的
原团,序列数据征分别存放地佩昼酸和蛎白质数据库中。核春醚序列是查询核英醚数据库以
及蛎白质数据库时的主要画发点并皿有种趋骆,将核英陡数据序介入到邱白质数据
库的管理之中正如我们下面将要。这并不奇怪,因为数据库维护者与数探提
交者之闵的真探通讯将有利于保证f淅硫性提2日升他
在依多情泓下,
scquenee编碧序列,
理的借闭也明显地体现在M的Entrez之中,
9生成过程之中。在欧洲EB【口【作人员
卞核苷峻和蛰口质
探模型。这章
flatfile不论是
而ASN1才是代表
数据库的例豪姓足X刺的。本荣例少讪论皙在绍兴诚诞绍排
妙是仕GnBnkflatf的红度介绍序列数据,但必绍
,都八是ASN19
NGB数揪模城的语春GnankbhDV为核心,包吾了许多计算生物学客
历史上,弦$底先于核英酸数探库。在60年代别,Dsyheff和他的同事们收集了所有当
时已知的氙莲醚序列,这就是蛋白质序列与结林国朐CDyhefra.
蛎白质数探库后林成为FRGorgeetal.,1997。这本有
计算生物学资源撒下了科二。这仁在1965年i以都
3蚯了数伽川爆炸脚训
Decgan1993在堆团战予绍描达丁这一时期人类基团组i
项NH浅斯团招荣斧国吾同而诞生了GnBunk内个
式,这主婢是将学术闯物上公开发表的论文转换为更适合计算机使用的电子佳式。日本的DNA
数据库ITBJ,在儿年后加入了数据收集的合作。在1988年一汀三方会议尹后觉在租之
为国FDN列敲据库合作计划。达成了一顽砚议,对数据庞莲记录河用我间的根式,并
fileEVwebt生物

GonBanlF利数探库贝团241
木征个数据库只仁
责更新提交到连一数据库的邦些致据。现在三个中心都收集目挂提交的数
布。这样,任何一个中心郡拥有并发布所有的序列数据。这种方式下每
i河的数排库所招有,也髅是说日有生成这条记录的数排版可以对记录
吾则如果征个数据库都可以修改任条记录,非夏盟
近年李的安排保证一没有一仁数据帕司b
在邪里生成序列数据,
【具例红MCB的Entrezy见
8的,分人到收雄数据,提
物学家进行骄证,陂日5
B3现在正在开发的SS侃明
工具,并明作为研究机构李研究
将能夜最大限度地服务于用户群体。在这
的研究与理解这挂大春数据的方法也不断深现
这一帝的看重仁组GnBank佳芸酶数据底,GnBunk是包含了三个重要蛇白质数据库Swpss。
君ot,玖聋FCB的一系列数据库中的一个。这系列敦据库中的个部对数据库现在和
将来的使用方法产生了或交生过重大影响。PCB居关于核酸和蛎日质结枭的数据库,。
帝个详经仁组、SWiss。Prot和PIRWJ以称为二级数据库,它比已经孙在于级数据库中
提供了更多的信息。SwissPrat积F个的弧自质序列主要来源于桀范数据库,另外小部
分是真挥口Suiss。Prot提交的这些蛎白层是目3战者是从公开发表的论文中搜索
到的。这里没有详组讨论这些惧况,我们建训读者通过其他逵径了解曰多的详情Bsiroch
andApveiller1997iGo