1 / 77
文档名称:

生物信息学技术课件.ppt

格式:ppt   大小:2,774KB   页数:77页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

生物信息学技术课件.ppt

上传人:文库新人 2022/3/1 文件大小:2.71 MB

下载得到文件列表

生物信息学技术课件.ppt

相关文档

文档介绍

文档介绍:关于生物信息学技术
第一页,共77页幻灯片
第一节 生物信息学的概述
第二页,共77页幻灯片
一、生物信息学(Bioinformatics)
这一名词的来由
八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的子


DNA序列数据
蛋白质序列数据
生物分子结构数据
生物分子功能数据
最基本
直观
复杂
生物分子数据类型
第十七页,共77页幻灯片
DNA
核酸序列
蛋白质
氨基酸序列
蛋白质
结构
蛋白质
功能
最基本的
生物信息
维持生命活动的机器
第一部
遗传密码
第二部
遗传密码?
生命体系千姿百态的变化
生物分子数据及其关系
第十八页,共77页幻灯片
第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少
对于第二部密码,目前则只能用统计学的方法进行分析
无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。
生物分子数据是宝藏,
生物信息数据库是金矿,等待我们去挖掘和利用。
第十九页,共77页幻灯片
生物分子信息的特征
生物分子信息数据量大
生物分子信息复杂
生物分子信息之间存在着密切的联系
第二十页,共77页幻灯片
第二节 生物信息学主要研究内容
第二十一页,共77页幻灯片
生物信息学主要研究内容
1、 生物分子数据的收集与管理
2、 数据库搜索及序列比较
3、 基因组序列分析
4、基因表达数据的分析与处理
5、蛋白质结构预测
第二十二页,共77页幻灯片
基因组
数据库
蛋白质
序列
数据库
蛋白质
结构
数据库
DDBJ
EMBL
GenBank
SWISS-PROT
PDB
PIR
1、 生物分子数据的收集与管理
第二十三页,共77页幻灯片
2、 数据库搜索及序列比较
搜索同源序列在一定程度上就是通过序列比较寻找相似序列
序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述
多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。
第二十四页,共77页幻灯片
发现同源分子
第二十五页,共77页幻灯片
3、 基因组序列分析
遗传语言分析——天书
基因组结构分析
基因识别
基因功能注释
基因调控信息分析
基因组比较
第二十六页,共77页幻灯片
4、基因表达数据的分析与处理
基因表达数据分析是目前生物信息学研究的热
点和重点
目前对基因表达数据的处理主要是进行聚类分
析,将表达模式相似的基因聚为一类,在此基
础上寻找相关基因,分析基因的功能
所用方法主要有:
相关分析方法
模式识别技术中的层次式聚类方法
人工智能中的自组织映射神经网络
主元分析方法
第二十七页,共77页幻灯片
基因芯片
第二十八页,共77页幻灯片
第二十九页,共77页幻灯片
第三十页,共77页幻灯片
层次式聚类
第三十一页,共77页幻灯片
二维电泳图
第三十二页,共77页幻灯片
5、蛋白质结构预测
蛋白质的生物功能由蛋白质的结构所决定 ,蛋白质结构预测成为了解蛋白质功能的重要途径
蛋白质结构预测分为:
二级结构预测
空间结构预测
蛋白质折叠
第三十三页,共77页幻灯片
二级结构预测
在一定程度上二级结构的预测可以归结为模式识别问题
在二级结构预测方面主要方法有:
立体化学方法
图论方法
统计方法
最邻近决策方法
基于规则的专家系统方法
分子动力学方法
人工神经网络方法
预测准确率超过70%的第一个软件是基于神经网络的PHD系统
第三十四页,共77页幻灯片
空间结构预测
在空间结构预测方面,比较成功的理论方法是同源模型法
该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构
运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作
第三十五页,共77页幻灯片
第三节 生物信息学当前的主要任务
第三十六页,共77页幻灯片
纵观当今生物信息学界的现状,可以发现,大部分人都把注意力集中在基因组、蛋白质组、蛋白质结构以及与之相结合的药物设计上
第三十七页,共77页幻灯片
1. 基因组
新基因的发现
通过计算分析从EST(Expressed Sequence Tags)序列库中拼接出完整的新基因编码区,也就是通俗所说的“电子克隆”;通过计算分析从基因