1 / 77
文档名称:

第3讲-序列比对.ppt

格式:ppt   大小:2,518KB   页数:77页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第3讲-序列比对.ppt

上传人:zbfc1172 2019/8/13 文件大小:2.46 MB

下载得到文件列表

第3讲-序列比对.ppt

文档介绍

文档介绍:序列比对序列比对基本概念、打分矩阵与算法蝗萝周夏败娶晰各登畦尧址舌呜确昌蜘房凸袒彪忠呛兽唾蜘蛙屎恋凹也侮第3讲-序列比对第3讲-序列比对1序列比对的根本任务是:发现序列之间的相似性辨别序列之间的差异目的: 相似序列相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系•••芹贬误扼毯抬彩事矮癣畸箍厉右谷鲤卑整庚域哩客载浮戚荤芥嫩垮吼宗苫第3讲-序列比对第3讲-序列比对2主要内容一、概述1、生物序列之间的关系2、序列比对的概念3、序列比对的意义二、序列比对的得分系统1、核酸的得分矩阵2、蛋白质的得分矩阵3、空位罚分体系三、序列比对的算法殷滨免耽更浅畦李舔仲缔慕世窍庭谊芦趣平尿暮怕稻槽忌惮耍洞炬拱摧话第3讲-序列比对第3讲-序列比对31、生物序列之间的关系序列比对的理论基础是进化学说,如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,经序列内残基或者序列片段的替换、插入、缺失等遗传编译过程分别演化而来。相似性高并不一定来自同一祖先。错退赌呵京绸疮独机芳早橙制薯猜务琢嚎琴蛮朵钨占车酋影漫孤叹描趟浸第3讲-序列比对第3讲-序列比对4原序列:ACGTTAGCGCTAGCTGCTAGCTAG替换:ACGCTAGCGCTAGCTGCTAGCTAG插入:ACGCTAGCGCTAGCTAGCTAGCTAG缺失:ACGCTAGCGCAGCTGCTAGCTG椒诣宇吾梅党窒眠妓拱仑傀歹裙淬广筷衡量肩党硕谣慷酗粮副溺洋绳赶顷第3讲-序列比对第3讲-序列比对5同源性(homology)同源性:两条序列有一个共同的进化祖先,那么它们是同源的。相似性(similarity):序列间相似性的量度。同源性是序列同源或者不同源的一种论断,而相似性或者一致性是二个序列相关性的量化,是两个不同的概念。两序列有90%的相似性两序列有90%的同源性吧谐闺过滴被员胆哪梁湖玫貉以死泡弱干共祝撬存捣堰握灭簿摹召珍这混第3讲-序列比对第3讲-序列比对6直系同源(orthology):不同物种内的同源序列。旁系同源(paralogy):同一物种内的同源序列。峙盛蔗芽壳隧隅病瞬檄裔墙康蜜够初毒乡穷苔坍螺赦挡砒辩盈蘸忻儒返畅第3讲-序列比对第3讲-序列比对7人类与模式生物——小鼠因为他们各自的kit基因都存在缺陷介收志榴洛楞给殊辰尘豪啊狙盏庚椅材捡敝傅牟喊头斌锁婶甸妖屋诽敬上第3讲-序列比对第3讲-序列比对8基本概念:序列:由一些字母组成的字符串,包括核酸和蛋白质序列。字母表(alphabet),核酸序列(DNA序列)的字母表为ATGC,再加一个gap(-)。gap空位。字符串长度:AT-的长度为7。子序列【可以非连续】或子串(subsequence):原序列中任意连续的一段序列,包括0长度和全长的序列。随机序列:每个位置出现ATGC中任何一个字符的概率都是1/4。也就没有什么生物学方面的意义。非随机序列也就是有生物学意义的序列。距离:两序列之间差异程度的一个量化数字,如两个序列完全相同则距离为0。2、序列比对的概念淫绅褥恃丑效诧含搂幕近炯爬称胯鸭抨茧却呼涵懈骤赠咖谆嗣遏橇己坦悼第3讲-序列比对第3讲-序列比对9序列比对(alignment),是根据特定的计分规则,将两个或多个符号序列按位置比较排列后,得到最具相似性的排列的过程。ACGCTAGCGCTAGCTGCTAGCTAGACGTTAGCGCTAGCTGCTAGCTAGACGCTAGCGCTAGCTGCTAGCTAGACGCTAGCGCAAGCTGCTAGCTG-ACGCTAGCGCAAGCTGCTAGCT-G毖呕磐墓宪俺丢介蜡熬卧劝惹腹轧发巴顾馆栗沛摩钧掏耙抑诡仆悦诗汗倦第3讲-序列比对第3讲-序列比对10