1 / 152
文档名称:

基因组信息分析.ppt.ppt

格式:ppt   页数:152页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因组信息分析.ppt.ppt

上传人:xcweywk961 2015/11/5 文件大小:0 KB

下载得到文件列表

基因组信息分析.ppt.ppt

相关文档

文档介绍

文档介绍:第5章
基因组信息分析
关于遗传语言
原核基因组特点
真核基因组特点
基因组序列分析
基因识别方法
非编码区与分析和调控元件建模
第一部分:
搜索遗传语言;
原核、真核基因组特点
1、基因组DNA的奥秘
遗传信息存贮在4种字符组成的核酸序列中
“天书”——用遗传语言书写的人类遗传蓝本
包含的信息量巨大
更重要的是目前人类对它了解甚少
天书中只有4个字符(碱基A、T、G、C)
既没有段落,也没有标点符号
是一个长度为3×109的一维序列。
科学家对这本天书了解最多的部分就是遗传密码
或者说掌握了DNA对蛋白质编码的规律
关于密码子
(1)密码子的使用是非随机的
如果密码子的第一、第二位碱基是A、U,
那么第三位将尽可能使用G、C;反之亦然。
如果三位都用G、C,则配对容易,分解难;
三位都用A、U,则相反。
一般地说,高表达的基因,要求翻译速度快,
要求密码子和反密码子配对快、分手也快。
(2)密码子的使用有一定的统计规律
对同义密码子的使用存在着偏爱
不同种属偏爱的密码子不同
人类基因组:
密码子第三位取A、U的情况占90%
而第三位取G、C仅占10%
密码子的使用偏性与基因功能、蛋白质结构相关
(3)密码子中的密码
三个碱基的位置与所编码的氨基酸性质存在着联系
例如:
芳香族氨基酸——以U作为第一位碱基
中间位置碱基的性质与氨基酸是亲疏水性相关
疏水氨基酸的密码子,其第二位碱基是U
亲水氨基酸的密码子,其第二位碱基是A
第二位碱基是G、C的密码子所编码的氨基酸亲水性、疏水性居中。
基因组信息
人类基因组:
编码区域只占1%-3%
对于非编码序列,尚不清楚其含义或功能
非编码区域对于生命活动具有重要的意义
包括内含子、简单重复序列、移动元件、伪基因
重复序列:
卫星(satellite)DNA
小卫星(mini-satellite)DNA
微卫星(micro-satellite)
顺式调控元件:
启动子、增强子、沉默子
2、探索遗传语言
用语言学的方法进行研究
自然语言
计算机程序设计语言
遗传语言
二进制序列0、1的长程关联性分析结果:
编码区域——自然语言
非编码区域——程序设计语言
蛋白质编码区域所包含的信息相当于待加工的“数据”
数据经过加工处理以后产生对应的蛋白质;
而非编码区域则相当于“程序”或“指令”,确定如何在时间和空间方面控制基因的表达和蛋白质的合成
用密码学方法进行研究
是否存在其它密码?
——调控信息密码?
——蛋白质结构的密码?
编码在DNA上的一维程序如何在四维时空中控制生命体的生长发育
3、关于生物复杂性
生物的复杂性不仅仅是基因的数目
人类基因约为30000个
线虫有20000个基因
230000/220000=210000≌103000