1 / 64
文档名称:

贝叶斯神经网络及其在蛋白质二级结构预测中的应用.pdf

格式:pdf   页数:64
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

贝叶斯神经网络及其在蛋白质二级结构预测中的应用.pdf

上传人:durian 2014/5/6 文件大小:0 KB

下载得到文件列表

贝叶斯神经网络及其在蛋白质二级结构预测中的应用.pdf

文档介绍

文档介绍:上海大学
硕士学位论文
贝叶斯神经网络及其在蛋白质二级结构预测中的应用
姓名:邵建林
申请学位级别:硕士
专业:系统分析与集成
指导教师:王翼飞
20040501
摘要的研究领域包括两方面,一方面是预测算法的研究,另一方面是基于序列联配的本文着重于对预测算法的研究,提出了一种新的基于贝叶斯神经网络的蛋白质二级结构预测方法。贝叶斯体系下的神经网络模型具有自动控制模型复杂度与神经网络模型建模的贝叶斯方法及其实现方法;其次,建立了全贝叶斯框架下用贝叶斯神经网络模型与传统的神经网络模型的性能,结果表明骄鵪精度在四组交叉证实数据集与测试数据集下分别提高了ズ.%:此外,提出了~种有效缩短模拟过程中“”阶段的交叉证实初值关键词:蛋白质二级结构预测,贝叶斯神经网络,马尔可夫链蒙特卡罗,借助计算机工具从氨基酸序列直接预测蛋白质三维结构,对于缩小蛋白质序列数据与结构数据数量之间的差距至关重要。蛋白质二级结构预测作为蛋白质三维结构预测的一种简化和过渡,继续得到广泛关注。通常,蛋白质二级结构预测信息提取技术的研究。学习过程中的过拟合等优点。首先,详细地探讨了显著度框架和全贝叶斯框架下于分类的贝叶斯神经网络模型,并将它用于蛋白质二级结构预测:最后,。方差信息准则珺收敛性诊断年上海大学硕士掌位论文
;,瑃.,,.。,.,,籹珺;,,年4笱妒垦宦畚甀
日期:础』:丝本论文使用授权说明原创性声明或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何C艿穆畚脑诮饷芎笥ψ袷卮斯娑本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表贡献均已在论文中作了明确的说明并表示了谢意。本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容。
本文的研究工作受上海市重点学科建设项目以及国家呒际跹芯糠⒄辜苹目资助。
第一章绪论引言庑蚣际跫凹扑慊际醯姆伤俜⒄故沟梅肿由镅Ь诵畔⒏锩代,并随之产生了一门新的学科一一生物信息学。生物信息学是一门新兴的交叉性学科,通过融合生物、计算机、数学等学科技术对生物数据进行管理和分析,揭示数据中所蕴含的生物学意义。蛋白质结构与功能预测正是的序列进行分析进而揭示相关基因的功能。蛋白质的功能在很大程度上决定于其空间结构,获取蛋白质的结构信息对于研究蛋白质的功能及其作用机制,并在此基础上进行有关的生物工程研究有着重要意义【俊@檬笛榉椒如湎呔学、多维核磁共振等缘鞍字式峁菇胁舛ù嬖诘鞍字示迮嘌选⒕褰构测定周期长、对样本纯度要求高等缺点,从而导致实验测定蛋白质结构的速度远远落后于序列测定速度,使得蛋白质序列数据和结构数据数量之间的差距越来越大。因此,我们迫切需要一种不依赖于晶体培养、不受分子量大小限制等因素快揭示基因功能及缩小蛋白质结构数据与序列数据数量之间的差距。蛋白质结构预测是指从蛋白质的氨基酸序列预测出其三维空间结构,目的是行结构与功能的研究以及蛋白质分子设计工作。理解、揭示蛋自质序列与其三维同时对于生物技术的发展也具有指导意义缥R┪锓钟枭杓铺峁┬畔⒌。蛋白质结构预测的理论基础是蛋白质的氨基酸序列唯一地决定其三维空间结构,即蛋白质氨基酸序列包含了三维空间结构的所有信息。研究表明,同源蛋白质话闳衔P蛄邢嗨%哂邢嗨频目占浣峁埂因此,以此为理论基础的同源模建较为理想的蛋白质结构预测方法。若目标蛋白质与结构数据库中的蛋白质具有同源性,则通过联配方法可以较为准确地预测目标蛋白质的三维结构”。另外,蛋白质结构被测定,出现新的折叠类型的可能性在减少,从而以蛋白质的折叠子为模板的反向折叠识另质结构预测方法。但无论是同源模建还是反向折叠识别都需要已知的蛋白质结构生物信息学中的一项重要研究内容。基因组计划及其他测序工作的最终目的是通过对所测得制约的、快速易行的蛋白质结构预测方法,以便加速蛋白质结构信息的获取、尽利用已知的蛋白质氨基酸序列构建出蛋白质的立体结构模型,进而在此基础上进空间结构之间的关系是生物信息学的主要目标之一【,该问题可以看成是中心法则的延伸,被称为“第二套密码子”问题,它的解决不仅有着重要的理论意义,椒ㄒ丫晌R恢由于很多相似性很低的远源蛋白存在相同的折叠结构,同时由于随着越来越多的方法也成为一种重要的蛋白年上海大学硕上学位论文
蛋白质二级结构预测的意义模板时都难以成功实现。与前两种方法相比较而言,从头预澳方法可直接从蛋白质序列预测其三维空间结构,无需已知的空间结构信息,因而优化等问题,使得从头预测方法变锝复杂与困难,因而通常借助蛋白质二级结构预测醇蚧缘鞍字嗜占涞脑げ,把二级结构预测看成是从氨基酸序列直接预测蛋白质结构的桥梁