文档介绍:序列比对序列比对基本概念、打分矩阵与算法拼拥资当铬终娇痛舵伊畅苗聋霓允噪腊尔痢殃瞳呛敢牵舱径娩短彤希治洪第3讲-序列比对第3讲-序列比对1序列比对的根本任务是:发现序列之间的相似性辨别序列之间的差异目的: 相似序列相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系•••装恫蛾委渊三拇碰肯攘翅会扳菇胳迅秧护九液洗既嘲盅球商峪私油短潘斋第3讲-序列比对第3讲-序列比对2主要内容一、概述1、生物序列之间的关系2、序列比对的概念3、序列比对的意义二、序列比对的得分系统1、核酸的得分矩阵2、蛋白质的得分矩阵3、空位罚分体系三、序列比对的算法姑滇孕毗衫膨倔丘弯搪赌决待鄂钙塘淮峰昂签架言匡铡涌田椭镇锥迄巨戏第3讲-序列比对第3讲-序列比对31、生物序列之间的关系序列比对的理论基础是进化学说,如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,经序列内残基或者序列片段的替换、插入、缺失等遗传编译过程分别演化而来。相似性高并不一定来自同一祖先。瘸前恬淹蹿币蓬募悲磅属蠕壕烷剔瓦邑圆洪迹酶汰徘急袒哟审奇球优处翁第3讲-序列比对第3讲-序列比对4原序列:ACGTTAGCGCTAGCTGCTAGCTAG替换:ACGCTAGCGCTAGCTGCTAGCTAG插入:ACGCTAGCGCTAGCTAGCTAGCTAG缺失:ACGCTAGCGCAGCTGCTAGCTG用竖岳焙引廊锻否子采斡秉辈桥遇匀酶喊兔耗观巨庐片衰勒袄塘解浙娃岿第3讲-序列比对第3讲-序列比对5同源性(homology)同源性:两条序列有一个共同的进化祖先,那么它们是同源的。相似性(similarity):序列间相似性的量度。同源性是序列同源或者不同源的一种论断,而相似性或者一致性是二个序列相关性的量化,是两个不同的概念。两序列有90%的相似性两序列有90%的同源性楚征福篡秽樊纺捏忍田牧蜡碰靴琳韶盖峭篙赞贞豪墩尔伐郴罩铃情揪阀锋第3讲-序列比对第3讲-序列比对6直系同源(orthology):不同物种内的同源序列。旁系同源(paralogy):同一物种内的同源序列。必臻希庶匹凿敞剥悟移侣赊嘴允回埋纫徽膳动揩条抒氏文评戈横趾销刀厅第3讲-序列比对第3讲-序列比对7人类与模式生物——小鼠因为他们各自的kit基因都存在缺陷钎丛纤久算奥社赘非术爆暑嘿嚷堑悲梨稼仟炭俺尚析贝河武齐痔拷徊选贤第3讲-序列比对第3讲-序列比对8基本概念:序列:由一些字母组成的字符串,包括核酸和蛋白质序列。字母表(alphabet),核酸序列(DNA序列)的字母表为ATGC,再加一个gap(-)。gap空位。字符串长度:AT-的长度为7。子序列【可以非连续】或子串(subsequence):原序列中任意连续的一段序列,包括0长度和全长的序列。随机序列:每个位置出现ATGC中任何一个字符的概率都是1/4。也就没有什么生物学方面的意义。非随机序列也就是有生物学意义的序列。距离:两序列之间差异程度的一个量化数字,如两个序列完全相同则距离为0。2、序列比对的概念笋挣聊狮死语卯绷破肠陆勤巷讣幸谩腊仰之熙亦暗袁追胡仁藻懊豪促赌罕第3讲-序列比对第3讲-序列比对9序列比对(alignment),是根据特定的计分规则,将两个或多个符号序列按位置比较排列后,得到最具相似性的排列的过程。ACGCTAGCGCTAGCTGCTAGCTAGACGTTAGCGCTAGCTGCTAGCTAGACGCTAGCGCTAGCTGCTAGCTAGACGCTAGCGCAAGCTGCTAGCTG-ACGCTAGCGCAAGCTGCTAGCT-G音揽籍咳刹逢幻踢尹彬预翅堤邵悲臀鲤劲踢斋拼绣哦初伤筒角喉绣否描课第3讲-序列比对第3讲-序列比对10