1 / 32
文档名称:

E__wcb_生物信息学(中译本)_第九章 系统发.pdf

格式:pdf   页数:32
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

E__wcb_生物信息学(中译本)_第九章 系统发.pdf

上传人:中国课件站 2011/12/4 文件大小:0 KB

下载得到文件列表

E__wcb_生物信息学(中译本)_第九章 系统发.pdf

文档介绍

文档介绍:
43
第九章系统发育分析
MrkAHErshkowitzandDetlefDLeipe
NtionalGnterforeteehnologyInformation
MNtional工braryofMdicine
MitionalInstitutesefHalth
BethesdaMryland
系统发有Ei
发有分林所推唤采的进化关航用分林国表进化林来握进,这万选化标就撑述
括了分孔进化培图树、物种进化以及分孔逃化和物帅进仙
个词拥有共同祖先的同一谕系在希脂9
学eladistica。在现代系
征我者其他特性,巾是生物大分于尤其是
居答未城的目的是感撰述一个万能的系统发有分析方法,但是这个日标过于天真,是不史能
实现的H1lsstal.,1993。星热人们已经谊计了大量的用于系统发育的答;
3用伯达是依颗于数控的结杰和大小,因此关
成了分类学和系统发育学期刊的热门课题CAise,1994Saitou1996
fordetal.。199G。诊Lis等人1993督经楚其简单地介绍过系统发
发育学有裆程
移是生物的
比起许多其宁学
的危除儿手是不史道
头驳某仙全多也轨足
用盯泉个荣友白的分忻和只门匕L恨俨
F州出某此伏处即敛枷袅到酌州娜会少一点,但是在概念上理解这些程序是如何处
理数据仍焦是个难题。
方法的指导有加下一
对牛吻序列进们系统
的首先,我们商允细一个慨含件的步
5的厂异足似的进果,而区个模型本包伟了方
刑于个好怕使用们系绿分析方法,刹函一个正确的模型同排绘
个正确的进化柏是同等重要的。古外,我们远将讨论一些匕轼通用的方法所红画的椿型,艺
目订论一卜燧此枳刑足伽何膨呐对数掰绀灿分机灿最后,我们会针寿系统发朋槲坦和进化
东的推论,提供一些具体方法应用的例子。
系统发育模型的组成
R法都会预先传定个迹化模城Pemmyetal.,1994。比如,所有广泛
傈用的方法都侵定分歧是声恒分枭的,国此我们可以用树状押发生图娄揣返已知的
数据。但是在个给定的数据组中,因为存在眉物秦的杂交以及物秋之间遇传物质的传通,
fileEVwebt生物

贝团,213
这个假定依可能会袖探翻。因正,如果所观宾的序列并非是河格造传的话,大多数系统发育
力法就会得到错误的结果。
系统发有万法中园有的模型会导致一些颜外的假定
1序列有指定的
Lesis,1996
并日正确无误HlbigandSeibold,1996HErshkowitzand
Saltiseta19977。
2序列是同源的也就是说,所有的序列都超源于同一视先序列,这亟序列不是
paralogparalog指的是一个柳先序列通过复制等方法在基国组中产生的歧化序
列的混合物
3序列比对中,不吟序列的同一个位点都
生在捣受分析的一个序列组中,序列之间的系统发育史是相名的比如,序列组中不存代
核序列与细胥濑序列的湾合。
5根札足以觞决感兴趣的问题。
6,样本序列之间的标异代表了感兴翩的寄组
7样本序列之间的差异包吴了足以解决感兴趣的问题的系统发有借号
远有一些假定,在棣惧方法中是黜认的,但是在古外一些方法中是可以修正的
8样札序列是随机迹化的。
9序列中的所有位点的迹化都是随机的
10,序列中的每一个位点的进化都是狱立的。
许多公开发表的系
现有的方法不能察江俞}
件,并合分林汝程相传调卜伽找们将会汕血分仙凰柠
系统发育数据分析比对,建立取代模型,建立进化树以及进
化树评估
对DV庞列进行系统发有分松的四个主要步霭是比对,建立取代模型,建立迹化柏以及进化树
评估。一航来说,执行这四个步骠的计算机程序都是相互独立的,伯是他们都是造
有分析的有机部分
卅训的叶论卞裴集卟月
傅的小1。
的方法同律适用于氧坂酸和寇码孔,市关于蛇白质的
讨论felsenstein1996。
述假定特刘合人
析D例卡侧的方法上,
Fj沦的迢川J桃酸碱轧
必特殊问题和程序会在别的地方得到
图为建树的标准在定程度上依糊比对和取代健型,国此一开始就应该介绍这些方法,诒些
介绍非常必要,三租主要的建咏方法分别是趾离、最大节约Cmmximmparsineny,M邵最
大似焊CnaxinumlikelihoodMD,郭离标考寡数据组中所有序列皋两西比切结枝,通达
fileEVwebt生物

33
应列网两之间的差异欣定进化林的拓扑结构和真枝长度。最大节约方法考宾数据组中序列的
多重比寿绑果,
大似然方法考察数据组中序列的多重比对结果,优化出拥有一定拓扑结构和余枝长度的进化
树,这个进化标能鲱以最大的颜率导敌考察的多重比对结果。这些方面将会在后面详细讨

建立数据模型比对