文档介绍:生物信息学研究的三个层面
初级层面:
基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题
——生物信息数据库(NCBI、EBI、DDBJ、UniProt等)
——基因组序列分析、序列比对软件(BLAST、CLUSTAL等)
——系统发育树构建软件的简单使用(PHYLIP、PALM等)
——搜集、整理有特色的生物信息学数据库
中级层面:
利用数理统计方法和相关的工具,研究生物信息学问题
——概率、数理统计基础
——现有的数理统计和科学计算工具(EXCEL、SPSS等)
高级层面:
提出有重要意义的生物信息学问题;自主创新,发展新方法,开发新工具,引领生物信息学领域研究方向。
——面向生物学领域,解决重要生物学问题
——利用数学、物理、化学、计算科学等思想和方法
——建立模型,发展算法
——自行编程,开发软件
序列比对算法
生物信息学第四讲
本章提要:介绍了序列相似性的概念,列举了描述DNA和蛋白质序列相似性的计分矩阵。介绍了序列比较的基本操作—“比对”的概念,以双序列比对为例详细学习了序列整体比对的Needleman-Wunsch算法,序列局部比对的Smith-Waterman算法。
1. 序列比对相关的基本概念
什么是生物序列?
生物序列一般指DNA、RNA或者蛋白质序列,比较不同类型的生物体序列的相互关系是生物序列分析的核心问题。
字母表和序列
字母表
4字符DNA字母表:{A, C, G, T}
扩展的遗传学字母表或IUPAC编码
单字母氨基酸编码
IUPAC碱基代码表
IUPAC氨基酸代码表