1 / 15
文档名称:

E__wcb_生物信息学(中译本)_第六章 NCBI数据.pdf

格式:pdf   页数:15
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

E__wcb_生物信息学(中译本)_第六章 NCBI数据.pdf

上传人:中国课件站 2011/12/4 文件大小:0 KB

下载得到文件列表

E__wcb_生物信息学(中译本)_第六章 NCBI数据.pdf

文档介绍

文档介绍:六芸M数探模144
第六章NCBI数据模型
前言数据模型
什么是数据模型
生物学家大都烈怠用动物模型米研究人作疾病。尽管人体疳病有可能垂动物中找不到完全
同的形式,但英种动物疤病和人体疤病有相当多的类何性质使我们可以从动物疾病中狼得的
数据李推断人作的疾痕过程通过将肌肉意簪和水压活袁的纬仕,将骨髂想象成李
臂叮以徘到俐痤肌肉H怦返驯数子9
艮人的斛助但矩徕尘有生物
复杂的情况下,出现了依多征合
一章不深入讨论绍节,只介组怡实用的宋引
及N楠野所趋皓作用。
模型的一些俪子
GenBant政据是bLDVWJ中心角度的数据报告见第2章,也就是bLC8格征为代表的殴编
码虹自质的DWYY列。限寇笛translationVD3Y捕述了将CDS栗征酝评成的复基戚嘉广。
其宁的DW督征例加nat*肤有时被GaBank数据应用米揭迭未余名蛋白质部分
山Eranslation撂述的切分P物,但这不是一秋仪人消葛的解决方法,相反,大多数蛇
质序列数据库以蛎白质为中心角度,这後可能宋全失042
间拳的用序列号表示其联系这些不提供准硫的寿基
酸对匹关系。
NCEI数据模型真推构造丁包吾DW8I蝴白质序列的模型。翻详的过程是由两积序列间的关系汪
定面不是山一科对古一种的解释硼命纳自质相关的注解例红肤如分产物是申蛟自历
H的
叭化会工人糯确的中侧耿。一组DWY刑和申它诙的蛎目质教
N为侧用这绍数据的中间数据。GcnBank数排格式只是人类可读
的一种竹妹奴枷形戏宁失去了有联系的序列集合,而倒洙回比转熟恶的邓秦序刑ELDVA
中心的视角。的目标是更真接的反哉数据的佐层结构。由EAST实现的从GnBunk到
绀山质序侧的佣译头5上是从蛇白质一核陛组得到蛎白质序列

a
E
nnornneonanee
wnsotu
Mopone
voes
soerlo
fileEVwebt生物

贝团,2115
s
unsews
nnonennoereee
Ansiotums
e
aey
ssora
E
aemeeat
Ansiocuw
e
a
soerioa
n
E
cnonee
nsiomosee
veaneas
a
s
p
ean
esneoede
E
nsnn
Anoswnhe
Inge
Jsselrecuio
E
I
nrmorsmenom

230
enosteeAa
Is
JsnnietoacipogAoesergwgn
ee
ecnt
Rsunmannnm
E
Unsen
Inoeeone
elpooenconunriy
、GoBenk格式仅仅指出了记录是有顾序的序列的一部
分,它不提佬关于其他部分是什么或它们之间如何联系皓。完整的话记录见

山d2182225&ormrCtdbzn&Doptzg
B新的QVt片段代表,新的GnBank根式的踵
以包育单个序列,己知长度的间陶,未知长度限
舒个组成成分休以传统格式表汛
CGonBuak恩式也随藏了一些DNyY列的多序列性。例如一航益义上,
有颗序的03
序的。
标地代表泽编矿区完整的序列命
序列屋断。在GnBank格式中
段记录之闭建立联系,CONIG可
这种桥式中没有特征及序列,但
个基图的三个外日子是
吾孔的慈个长度是没有被测
59应显子,没有个特征能消
三个外坤子是有定的顺庆并袖一定长度的未翻详的DW、
春会有SEGVBYI指出第一个记录是SENESI1of3第
个记录显SEGMBT2f3个记录春SEGVENT3ef但这以吾诉侧用者这是县没
;朋序的片段国61A。从避个Q盅nk角帅、,休用一种袖附为LOCLS的算法将无
段矿响止伸组仑徇以不同的数字结届,俪加
以怅叫不柑人们丁执肘这科复杂
为片段序列。具包吾的元素不是t
怎J构造们方经成。所以以上面的例子为例,片段序制包
肯RMON200bp侧娴RNKCFQ,术知长度的间降*RNCFNS。话片段序列积其他记录根有自已
的名称CRNKC、序列号、特征、位点和注觞们封这种形式的存借方式称为仪吴
RMCKL、RKCHQ、RKKCHG、所有中间献紫和特往的序列RMCR战集,当Gnank以核酸蛎白
质组形式发行时,片段集彼分成多条记录,片段集就泉失了。然页从Entrez国的视角看片殴
集,片段集象条线将它的组分连接在起。ITBIEEUGnBantk春近同意了一科方法用于代
表构造结构,。
不同于GnBunk拳式,NC片殴应列不要水片段闭有间随,事