1 / 183
文档名称:

基于氨基酸序列信息蛋白质结构与功能预测研究.pdf

格式:pdf   页数:183
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于氨基酸序列信息蛋白质结构与功能预测研究.pdf

上传人:2028423509 2014/6/1 文件大小:0 KB

下载得到文件列表

基于氨基酸序列信息蛋白质结构与功能预测研究.pdf

文档介绍

文档介绍:中山大学
博士学位论文
基于氨基酸序列信息的蛋白质结构与功能预测研究
姓名:李占潮
申请学位级别:博士
专业:分析化学
指导教师:邹小勇
20090607
基于氨基酸序列信息的蛋白质结构与功能预测研究摘要专业:分析化学姓名:李占潮导师:邹小勇教授随着人类基因组计划的顺利完成,以及现代生物科学和技术的飞速发展,每天都有海量的蛋白质序列数据不断地涌现。如何揭示这些数据的内涵,提取有用的化学与生物信息,已经成为化学计量学和化学信息学的研究热点。虽然可以通过实验的方法确定蛋白质的结构和功能,但是实验方法既费时又费力,,从蛋白质序列出发,发展自动、可靠的理论和计算方法预测蛋白质的算法、小波变换以及主成分分析等方法应用于化学生物信息的处理,提出了一系列的蛋白质结构和功能预测新方法,其主要内容如下:⒘嘶谝糯惴ㄓ胫С窒蛄炕詈系牡鞍字式峁估嘣げ夥椒ā;于信息融合的思想,利用改进的遗传算法同时优化支持向量机的核参数和用来表征蛋白质一级结构的描述符子集。对包含龇峭吹鞍字实腃准数据集进行了预测,徊嫜橹さ淖芫ǘ却锏搅%,并且对于较难预测的和嗟鞍字试げ饩ǘ确直鸫锏搅%和ィ飨杂于文献报道值。结果表明:本文提出的方法能够有效的提高蛋白质结构类的预测精度,并且有望用于蛋白质其它属性的预测。岢隽诵碌奈卑被嶙槌杀硎痉椒ā;诹〔ū浠坏氖庇蚝推涤分析特性以及主成分分析的数据压缩和特征提取性能,首先用氨基酸残基的各种物理化学性质参数将蛋白质序列映射为数值序列,然后进行连续小波变换,计算小波功率谱,最后利用主成分分析技术对小波功率谱进行数据压缩,结构和功能具有十分重要的理论和实际意义。本文立足于大量的生物信息数据,将化学计量学中的支持向量机、遗传
并与氨基酸组成相结合,构成伪氨基酸组成表征蛋白质一级结构。将其与支持向量机结合,采用一对一的分类策略,对蛋白质结构类预测进行了研究。对文献报道的标准数据集进行了预测,徊嫜橹け砻鹘峁庞诖蠖数文献报道值。结果表明:基于连续小波变换和主成分分析方法的伪氨基酸组成表征方法能够有效的反映蛋白质序列中的长程相互作用和氨基酸序列次序信息,从而提高预测精度。⒘薌蛋白偶联受体功能类预测新方法。基于各种蛋白质一级结构描述符和特征子集选择方法,提出了双层支持向量机方法,用于鞍着剂受体功能类预测研究。预测系统的第一层主要预测一个给定的蛋白质是否是蛋白偶联受体,如果是,则通过预测系统的第二层精确预测是哪一种功能类。对文献报道的数据集进行了徊嫜橹ぃ坎愕脑げ饩ǘ让飨愿哂谖献值。结果表明:最优特征子集能够获取与鞍着剂J芴骞δ芾嘧钕喙氐描述符,从而提高鞍着剂J芴逶诔易搴图易逅降脑げ饩ǘ取⒘说鞍字视氲鞍字氏嗷プ饔迷げ庑路椒āJ紫龋诓煌母貉本产生策略,研究了氨基酸组成、二肽组成、各种自相关函数以及组成,转变和分布等描述符对不同数据集的预测能力。然后,基于特征选择方法,采用支持向量机预测蛋白质与蛋白质的相互作用。结果表明:各种描述符对于基于不同负样本的数据集的预测能力各不相同,负样本的参数策略是影响预测精度的重要因素,基于特征选择技术的最优描述符子集能够明显地提高蛋白质与蛋白质相互作用预测的精度。⒘嘶诹W尤河呕惴ㄓ胫С窒蛄炕囫詈系慕7椒āU攵粤子群优化算法中群体多样性降低导致“早熟南窒螅糯惴ǖ谋湟焖想引入到粒子群优化算法中,并将改进的杂交粒子群优化算法与支持向量机耦合进行定量结构活性关系研究。改进的连续和离散粒子群优化算法分别用于优化输入支持向量机的分子结构描述符子集和核参数。、均方根差和臣浦捣直鸫锏搅..和.,优于文献报道值,表明了该方法的有效性。关键词:支持向量机,遗传算法,粒子群优化算法,主成分分析,小波变换Ⅱ
篈琣::.缶神鰌...
.ィ..‘⑽,甀韊.%..%...Ⅳ,
,锄吨甌螹,甌籺宅ⅱ,.,.篠
日期:卿多月学位论文作者签名:孝易/绷论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究作出重要贡献的个人和集体,。
导蛹签名:乌喜日期:月学位论文作者签名:孝占/纠日期:渺暾荚/日学位论文使用授权声明本人完全了解中山大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆、院系资料室被查阅,有