文档介绍:实****一基因组数据注释和功能分析
.
1
实****一
基因组数据注释和功能分析
实****二
核苷酸序列分析
实****三
芯片的基本数据处理和分析
实****四
蛋白质结构与功能分析
实****五
蛋白质组学数据分析
实****六
系统生物学软件实****br/>课程内容
基因组学
转录物组学
蛋白质组学
系统生物学
.
2
通过序列比对工具BLAST学****了解蛋白编码基因的功能注释原理
介绍多序列联配工具ClustalX
分子进化分析软件MEGA4的基本知识,掌握系统发生树绘制的基本方法
.
3
序列比对的进化基础
什么是序列比对:
将两个或多个序列按照最佳匹配方式排列在一起。
对应的相同或相似的符号排列在同一列上。
错配与突变相应,空位与插入或缺失对应。
序列比对的目的:
从核酸以及氨基酸的层次去分析序列的相同点和不同点,以推测他们的结构、功能以及进化上的联系
通过判断两个序列之间的相似性来判定两者是否具有同源性
相似性:可以被数量化,如:序列之间相似部分的百分比
同源性:质的判断,两个基因在进化上是否曾有共同祖先的推断
.
4
BLAST
基本局部比对搜索工具(Basic Local Alignment Search Tool)
NCBI上BLAST服务的网址:
/
NCBI上blast程序的下载:
/blast/executables/release/
NCBI的BLAST数据库下载网址:
ftp:///
.
5
选择物种
选择blast程序
.
6
QuerySequence
AminoacidSequence
DNASequence
tBLASTx
BLASTx
BLASTn
tBLASTn
BLASTp
Nucleotide
Database
Protein
Database
Nucleotide
Database
Nucleotide
Database
Protein
Database
Translated
Translated
Translated
.
7
程序名
搜索序列
数据库
内容
备注
blastp
Protein
Protein
比较氨基酸序列与蛋白质数据库
使用取代矩阵寻找较远的关系,进行SEG过滤
blastn
Nucleotide
Nucleotide
比较核酸序列与核酸数据库
寻找较高分值的匹配,对较远的关系不太适用
blastx
Nucleotide
Protein
比较核酸序列理论上的六个读码框的所有转换结果和蛋白质数据库
用于新的DNA序列和ESTs的分析,可转译搜索序列
tblastn
Protein
Nucleotide
比较蛋白质序列和核酸序列数据库,动态转换为六个读码框的结果
用于寻找数据库中没有标注的编码区,可转译数据库序列
tblastx
Nucleotide
Nucleotide
比较核酸序列和核酸序列数据库,经过两次动态转换为六个读码框的结果
转译搜索序列与数据库序列
.
8
以Blastx为例:
目标序列为ATG AGT ACC GCT AAA TTA GTT AAA TCA AAA GCG ACC AAT CTG CTT TAT ACC CGC
6个读码框翻译
5’端到3’端
第一位起始:
ATG AGT ACC GCT AAA TTA GTT AAA TCA AAA GCG ACC AAT CTG CTT TAT ACC CGC
第二位起始:
TGA GTA CCG CTA AAT TAG TTA AAT CAA AAG CGA CCA ATC TGC TTT ATA CCC GC
第三位起始:
GAG TAC CGC TAA ATT AGT TAA ATC AAA AGC GAC CAA TCT GCT TTA TAC CCG C
3’端到5’端
第一位起始:
GCG GGT ATA AAG CAG ATT GGT CGC TTT TGA TTT AAC TAA TTT AGC GGT ACT CAT
第二位起始:
CGG GTA TAA AGC AGA TTG GTC GCT TTT GAT TTA ACT AAT TTA GCG GTA CTC AT
第三位起始:
GGG TAT AAA GCA GAT TGG TCG CTT TTG ATT TAA CTA ATT