文档介绍:Blast和Fasta的应用与原理
Blast和Fasta的应用与原理Blast和Fasta的应用与原理生物序列的相似性相似性:
是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。当然可进行自身局部比较。2
生物序列的相似性
相似性:
是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。当然可进行自身局部比较。
2
同源性:
指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。
生物序列的同源性
3
相似性和同源性关系
序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。
正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80%一说。
4
序列相似性比较和序列同源性分析
序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;
序列同源性分析:
是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;
5
Blast简介(一)
BLAST 是由美国国立生物技术信息中心(NCBI)
开发的一个基于序列相似性的数据库搜索程序。
BLAST是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。
6
Blast 是一个序列相似性搜索的程序包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。比如说查询的序列为核酸,查询数据库亦为核酸序列数据库,那么就应该选择blastn程序。
下表列出了主要的blast程序。
Blast简介(二)
7
主要的blast程序
程序名
查询序列
数据库
搜索方法
Blastn
核酸
核酸
核酸序列搜索逐一核酸数据库中的序列
Blastp
蛋白质
蛋白质
蛋白质序列搜索逐一蛋白质数据库中的序列
Blastx
核酸
蛋白质
核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。
Tblastn
蛋白质
核酸
蛋白质序列和核酸数据库中的核酸序列6框翻译后的蛋白质序列逐一比对。
TBlastx
核酸
核酸
核酸序列6框翻译成蛋白质序列,再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对。
8
Blast相关的问题
怎么获得blast服务,怎么使用的问题?
为什么使用blast,可以获得什么样的信息?
其他问题:实际使用时选择哪种方式(网络,本地化),参数的选择,结果的解释…
9
Blast资源
:
(网络版)
(单机版)
:
(果蝇)
…
10