1 / 152
文档名称:

〖医学〗基因组信息分析[精].ppt

格式:ppt   大小:4,481KB   页数:152页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

〖医学〗基因组信息分析[精].ppt

上传人:yixingmaob 2018/1/16 文件大小:4.38 MB

下载得到文件列表

〖医学〗基因组信息分析[精].ppt

文档介绍

文档介绍:基因组信息分析
关于遗传语言
原核基因组特点
真核基因组特点
基因组序列分析
基因识别方法
非编码区与分析和调控元件建模
第一部分:
搜索遗传语言;
原核、真核基因组特点
1、基因组DNA的奥秘
遗传信息存贮在4种字符组成的核酸序列中
“天书”──用遗传语言书写的人类遗传蓝本
包含的信息量巨大
更重要的是目前人类对它了解甚少
天书中只有4个字符(碱基A、T、G、C)
既没有段落,也没有标点符号
是一个长度为3×109的一维序列。
科学家对这本天书了解最多的部分就是遗传密码
或者说掌握了DNA对蛋白质编码的规律
关于密码子
(1)密码子的使用是非随机的
如果密码子的第一、第二位碱基是A、U,
那么第三位将尽可能使用G、C;反之亦然。
如果三位都用G、C,则配对容易,分解难;
三位都用A、U,则相反。
一般地说,高表达的基因,要求翻译速度快,
要求密码子和反密码子配对快、分手也快。
(2)密码子的使用有一定的统计规律
对同义密码子的使用存在着偏爱
不同种属偏爱的密码子不同
人类基因组:
密码子第三位取A、U的情况占90﹪
而第三位取G、C仅占10﹪
密码子的使用偏性与基因功能、蛋白质结构相关
2、探索遗传语言
用语言学的方法进行研究
自然语言
计算机程序设计语言
遗传语言
二进制序列0、1的长程关联性分析结果:
编码区域──自然语言
非编码区域──程序设计语言
蛋白质编码区域所包含的信息相当于待加工的“数据”
数据经过加工处理以后产生对应的蛋白质;
而非编码区域则相当于“程序”或“指令”,确定如何在时间和空间方面控制基因的表达和蛋白质的合成
用密码学方法进行研究
是否存在其它密码?
──调控信息密码?
──蛋白质结构的密码?
编码在DNA上的一维程序如何在四维时空中控制生命体的生长发育
3、关于生物复杂性
生物的复杂性不仅仅是基因的数目
人类基因约为30000个
线虫有20000个基因
230000/220000=210000≌103000