文档介绍:*
*
梅艳珍
南京师范大学生命科学学院
**********
******@
基因组学研究——功能基因分析
现代生物学实验技术
第一页,编辑于星期六:二十一点 二十五分。
*
要求:
掌握常用的序列比对工具
能构建进化树
能够预测蛋白质的二级结构、疏水区、跨膜区等
能够进行简单的同源建模分析
了解KEGG数据库的检索
第二页,编辑于星期六:二十一点 二十五分。
*
序列比对——BLAST应用
第三页,编辑于星期六:二十一点 二十五分。
*
同源性(homology):
指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断。 A和B的关系上,是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。
相似性(similarity):
是指一种直接的数量关系,如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。
生物序列的同源性
序列间相似性越高,它们是同源序列的可能性就更高
第四页,编辑于星期六:二十一点 二十五分。
*
Blast程序评价序列相似性的两个数据
Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、 相似性越高,则Score值越大。
E value:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。
我们在获得一个Blast结果时需要看这两个指标。
如果Blast获得的目标序列的Score值越高并且E-value越低表明结果越可信,反之越不可信.
第五页,编辑于星期六:二十一点 二十五分。
*
主要的BLAST程序(功能)
程序名
查询序列
数据库
搜索方法
Blastn
核酸
核酸
在核酸数据库中比对核酸序列
Blastp
蛋白质
蛋白质
在蛋白质数据库中比对蛋白质序列
Blastx
核酸
蛋白质
在蛋白质数据库中比对待检的核酸序列(用所有6种可读框翻译)
Tblastn
蛋白质
核酸
在核酸数据库(用所有6种可读框翻译)中比对待检的蛋白质序列
TBlastx
核酸
核酸
在核酸数据库(用所有6种可读框翻译)中比对待检的核酸序列(也用所有6种可读框翻译)
第六页,编辑于星期六:二十一点 二十五分。
*
:///
组装的基因组序列库
基本blast
特定的BLAST
所有的
BLAST基
因数据库
第七页,编辑于星期六:二十一点 二十五分。
*
*
核酸数据库中
比对核酸序列
蛋白质数据库中
比对蛋白质序列
蛋白质数据库中
比对核酸序列
蛋白质数据库中
比对核酸序列
核酸数据库中
比对蛋白质序列
第八页,编辑于星期六:二十一点 二十五分。
*
Fasta格式文件
第九页,编辑于星期六:二十一点 二十五分。
*
*
什么是fasta格式?怎么建立?
新建一个txt文本文件,命名如:
Fasta的格式:
>序列名称
序列
第十页,编辑于星期六:二十一点 二十五分。