1 / 130
文档名称:

蛋白质结构预测中几个关键问题研究.pdf

格式:pdf   页数:130
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

蛋白质结构预测中几个关键问题研究.pdf

上传人:2890135236 2014/6/4 文件大小:0 KB

下载得到文件列表

蛋白质结构预测中几个关键问题研究.pdf

文档介绍

文档介绍:大连理工大学
博士学位论文
蛋白质结构预测中几个关键问题的研究
姓名:谷俊峰
申请学位级别:博士
专业:工程力学
指导教师:王希诚;蒋华良
20090501
摘要上世纪年代以来,庑蚍椒ǖ姆⒄估刍撕A康拇蠓肿有蛄惺菪畔ⅲ供给人们丰富的资源来研究蛋白质的生物功能。蛋白质的生物功能很大程度上取决于蛋白质的三维结构性质。虽然随着实验手段的发展,越来越多的蛋白质结构通过实验手段被测定了出来,但是还是远远落后于新的蛋白质序列的增长速度。如何缩小蛋白质序列以及结构之间的鸿沟已经成为分子生物学的一个中心课题。随着计算技术的发展,计算生物学或者称为生物信息学作为一门新的学科为这个问题提供了一种解决的途径。其主要依据来自于这样的假设,即蛋白质折叠所需要信息完全包含在蛋白质的一级序列之中。基于这一假设,同源模建、折叠识别以及从头预测等一系列基于序列的结构预测方法得到了广泛的发展,并取得了相当的成果。在此基础上,本文对蛋白质结构预测中一些关键问题,如蛋白质序列分析、蛋白质折叠识别势函数以及对处于序列相似性“朦胧区域”的蛋白质的结构预测等,进行了深入的研究。利用小波包在提取信号局部特征的优势,发展了一种基于小波包变换的多序列比对方法。小波包能够准确定位多个序列之间的相似区域,即保守域,增强了多序列比对精度且缩短了比对时间。在以及测试平台的帮助下,验证了本文所提出的多序列比对方法具有良好的精度以及速度,是一种有效的多序列比对工具。发展了一个简化蛋白质折叠识别函数,势函数包括三个简单的能量项:残基接触相互作用能、疏水能以及主链虚拟二面角扭转能,仅需要霾问哂屑扑慵虻サ奶点。利用一个蛋白质训练集,对势函数的参数系通过线性规划的方法求解。势函数的蛋白质自然构象识别能力在几个高质量的测试集上进行了验证,结果显示我们的势函数具有非常高的自然构象识别能力,与其他简化势函数比较其精度位于前列,具有良好的应用前景。提出了基于参数评价函数的蛋白质折叠识别势函数优化模型。参数评价函数把复杂的多目标多约束优化问题转化为单目标无约束问题,然后用共轭梯度法进行求解,不但降低了求解难度,而且使得在优化过程中其解远离可行域的边界,保证了对多目标中所有目标同时进行优化。在几个标准测试集上的测试结果表明,与基于线性规划的势函数相比,结果显示新的优化模型以及方法提升了势函数的质量。发展了一个基于遗传算法的绦颉F淠芰亢泳哂形锢硇裕六个能量项,成对接触相互作用使得目标序列与模板蛋白的匹配问题变成了一个完全问题。遗传算法是一个全局启发式算法,具有良好的搜索能力,在馐云教大连理工大学博士学位论文
关键词:蛋白质;多序列比对;势函数;折叠识别;蛋白质结构预测;上的测试也证明了本文所提出方法具有良好的折叠识别能力以及比对精度。另外,比对精度与折叠识别结果之间的关系也显示出了能量函数的合理性。本文的工作得到国家自然科学基金“药物分子优化设计的网格计算方法研究.”、《国家重点基础研究发展规划》项目“基于基因功能的创新药物研究.”和国家萍技苹翁狻靶乱┭蟹⑼馧钡淖蛋白质结构预测中几个关键问题的研究助。
.甒,大连理工大学博士学位论文甒,,甌,,琽,瑃.,,‘”.,“”,..:,..
甒,.篜;蛋白质结构预测中几个关键问题的研究籔;瑃.,.,.甈猚瑆..,甌.;籔——
作者签名:—堆牛一魄耳年上月丛日学位论文题目:益鱼匦丝塑墼丝竺睦焦妓克苄停大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。
大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论文。学位论文题目:作者签名:导师签名:大连理工大学博士学位论文
绪论引言这种情况下,一门新的学科——生物信息学便应时而生。生物信息学研究生物信息的采上世纪年代以来,由于远庑蚍椒ǖ姆⒄故沟鞍字蚀蠓肿有蛄惺萦辛指数级别的增长。这些数据被源源不断地录入到~些大型生物信息数据库诸如珼,以及甈龋晗感畔⑷。随着基因组测序计划的持续开展,研究重点逐渐从数据的积累转向数据的分析。在集、处理、存储、传播、分析和解释等各方面的一门学科