1 / 28
文档名称:

生物信息课件4.ppt

格式:ppt   页数:28页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

生物信息课件4.ppt

上传人:所以所以 2012/2/26 文件大小:0 KB

下载得到文件列表

生物信息课件4.ppt

文档介绍

文档介绍:第三章多序列比对
哈尔滨医科大学
生物信息学院
李霞教授
0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
+ + →+ + ↓+ ↓→
A T - G T T A T -
A T C G T - A - C
w A T C G T A C
V
A
T
G
T
T
A
T
图3-1 使用动态规划法寻找两个序列的最长公共子序列
0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
w A T C G T A C
V
A
T
G
T
T
A
T
0 0 0 0 0 0 0 0
0
0
0
0
0
0
0
1 1 1 1 1 1 1
1 2 2 2 2 2 2
1 2 2 3 3 3 3
1 2 2 3 4 4 4
1 2 2 3 4 4 4
1 2 2 3 4 5 5
1 2 2 3 4 5 5
+ ←←←←+ ←
↑+ ←←+ ←←
↑↑↑+ ←←←
↑+ ↑↑+ ←←
↑+ ↑↑+ ↑↑
+ ↑↑↑↑+ ←
↑+ ↑↑+ ↑↑
图3-2 动态规划表的填写
(i,j,k)
(i,j-1,k)
(i,j,k-1)
(i-1,j,k-1)
(i-1,j-1,k-1)
(i-1,j-1,k)
(i,j-1,k-1)
图3-3 计算三个序列间的一个比对单元(i,j,k)依赖于其7个前导项
(i-1,j,k)
图3-4 计算u=ATGTTAT,v=ATCGTAC,w=ATGC三序列比对的三维得分矩阵δ
ATGTTAT
ATCGTAC
A
T
G
C
序列列 A 列 B 列 C
1 ……T…………T…………T
2 ……T…………T…………T
3 ……T…………T…………T
4 ……T…………T…………T
5 ……T…………T…………C
6 ……T…………C…………C
T
T
T
T
T
T
T
T
T
T
C
T
T
T
T
T
C
C
T-T 匹配字符对
6(6-1)/2=15
T-C 匹配字符对
0
该列记分
6*15=90
-3*0=0
90-0=90
T-T 失配字符对
10
T-C 匹配字符对
5
该列记分
6*10=60
-3*5=-15
60-15=45
T-T 失配字符对
6
T-C 匹配字符对
9
该列记分
6*6=36
-3*9=-27
36-27=9
T
T
T
T
T
T
T
T
T
T
C
T
T
T
T
T
C
C
T-T 匹配字符对
6(6-1)/2=15
T-C 匹配字符对
0
该列记分
6*15=90
-1*0=0
90-0=90
T-T 失配字符对
10
T-C 匹配字符对
5
该列记分
6*10=60
-1*5=-5
60-5=55
T-T 失配字符对
6
T-C 匹配字符对
9
该列记分
6*6=36
-1*9=-9
36-9=27
图3-5 SP记分及得分和罚分参数对多序列比对有显著影响
AAAATTTT
TTTTGGGG
AAAAGGGG
AAAATTTT----
----TTTTGGGG
AAAATTTT----
AAAA----GGGG
AAAA----GGGG
----TTTTGGGG
AAAATTTT----
----TTTTGGGG
AAAA----GGGG
AAAATTTT
TTTTGGGG
GGGGAAAA
AAAATTTT----
----TTTTGGGG
----AAAATTTT
GGGGAAAA----
----GGGGAAAA
TTTTGGGG----
?
图3-6 三个序列的成对比对未必总能组合成一个多序列比对




A
B
C
权值
+=
+=

图3-7 ClusterW中对序列赋权的方法
图3-8 EBI站点 ClusterW在线服务的页面
S1
S2
S3
S4
pA=z11
pT=z12
pG=z13
pC=z14
p12=y1
开始
结束
p23=y2
p34=y3

p40=y4
p11=x1
p22=x2
p33=x3
p44=x4
pA=z21
pT=z22
pG=z23
pC=z24
pA=z31
pT=z32
pG=z33
pC=z34
pA=z41
pT=z42
pG=z43
pC=z44
图3-9 隐马尔科夫模型和三个蛋白质序列PHSFTYVMT、PGSFTYW、RFTGFW的最小公共超图