1 / 33
文档名称:

生物信息学课程设计报告-H7N9病毒非结构蛋白NS1的基因序列分析.docx

格式:docx   页数:33
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

生物信息学课程设计报告-H7N9病毒非结构蛋白NS1的基因序列分析.docx

上传人:164922429 2014/1/6 文件大小:0 KB

下载得到文件列表

生物信息学课程设计报告-H7N9病毒非结构蛋白NS1的基因序列分析.docx

文档介绍

文档介绍:生物信息学课程设计报告
题目:H7N9病毒非结构蛋白NS1的基因序列分析
专业:
班级:
学号:
姓名:
指导教师:
2013年 12月 19日
目录
1绪论 3
3
4
H7N9简介 5
6
课题设计的主要内容 6
本章总结 6
2 查找序列并进行Blast分析 7
7
对序列进行Blast分析 12
本章总结 15
15
目标 15
多序列比对过程 15
本章总结 18
4 构建系统发育树 19
目标 19
19
22
本章总结 26
5设计引物 26
目标 26
26
本章总结 32
6结果分析和讨论 32
结果分析 32
结果讨论 32
1绪论

生物信息学(Bioinformatics)[1]是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
生物信息学可以定义为对分子生物学中两类信息流的研究:
第一类信息流源于分子生物学的中心法则:DNA序列被转录为mRNA序列,后者被翻译为蛋白质序列。蛋白质序列继而折叠为具功能的三维结构。按照达尔文演化理论,这些功能被生物体的环境所选择,从而驱动群体中DNA序列的进化。因此,第一类的生物信息学应用关注于中心法则中任一阶段的信息传递,包括DNA序列中基因的组织与控制、确定DNA中的转录单位、从序列预测蛋白质结构以及分子功能分析。
第二类信息流是基于科学方法:提出关于生物学活动的假设,设计实验以验证这些假设,评估结果与假设的相容性,然后根据实验数据对原假设作扩展或修正。第二类的生物信息学应用关注于这一流程中的信息传递,包括产生假设、设计实验、通过数据库将实验结果组织起来、检验数据与模型的相容性以及修正假设的各个系统。
生物信息学的主要研究方向包括:
序列分析
计算进化生物学
生物多样性的度量
蛋白质结构预测
蛋白质表达分析
比较基因组学
基因表达分析
调控分析
生物系统模拟
当前一些发达国家的政府、科研机构均非常重视,纷纷建立相应的机构或部门进行这方面的研究、开发和服务。如美国国家生物信息中心( National Centre of
Biotechnology Information, NCBI),欧洲分子生物学网络( European Molecular
work, )。另外一些生物公司亦非常重视生物信息学并组建相关的部门来从事相应的研发和应用。
在我国,生物信息学随着人类基因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。许多科研单位已经开始或准备开始从事这方面的研究工作。北京大学研究建立起一个EMBL的镜像数据库(.cn ),并提供部分的检索服务。复旦大学遗传学研究所,为克隆新基因而建立的一整套生物信息系统也已初具规模
。中科院上海生化所、生物物理所等单位在数据分析和基因预测方面也有相当的基础。、

Blast
BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。(:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。,已将有缺口的比对序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核酸序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。
Fasta
FASTA程序是第一个广泛使用的数据库相似性搜索程序。程序引用取代矩阵实行局部比对以获得最佳搜索。但众所周知,使用这种策略会非常耗费工作时