1 / 46
文档名称:

使用集成聚类方法选取近天然蛋白质结构.pdf

格式:pdf   大小:2,204KB   页数:46页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

使用集成聚类方法选取近天然蛋白质结构.pdf

上传人:陈潇睡不醒 2021/9/18 文件大小:2.15 MB

下载得到文件列表

使用集成聚类方法选取近天然蛋白质结构.pdf

相关文档

文档介绍

文档介绍:分类号: 密级:公开


研 究 生 学 位 论 文


论文题目(中文) 使用集成聚类方法选取近天然蛋白质结构
Selecting Near-native Protein Structures from
论文题目(外文)
Ab Initio Models Using Ensemble Clustering
研究生姓名 李利
学科、专业 计算机科学与技术·计算机应用技术
研 究 方 向 生物信息
学 位 级 别 硕 士
导师姓名、职称 路永钢 教授
论 文 工 作
起 止 年 月 2017 年 3 月至 2018 年 4 月
论文提交日期 2018 年 4 月
论文答辩日期 2018 年 5 月
学位授予日期 2018 年 6 月



校址:甘肃省兰州市
使用集成聚类方法选取近天然蛋白质结构
摘要
现代生物学的许多研究都依赖于蛋白质的空间结构。通过蛋白质结构间的比
较,可以了解蛋白质结构之间的关系,理解进化过程中的演变,从而为推断其功
能提供重要信息。
经过不懈努力,许多结构测定方法不断发展完善。然而由于实验方法本身存
在的客观局限和巨大代价,已知蛋白质结构的数量远远落后于已知序列数量,发
展理论分析方法势在必行。
蛋白质折叠的物理化学机制目前尚未完全解决,基于能量函数和统计学知识
的方法仍是蛋白质预测领域最为成功的。而预测结构的分辨率往往决定着其研究
价值,如何从数量巨大的候选结构中选出最接近天然状态的结构却是一个悬而未
决的问题。
聚类分析是人们目前试图解决此问题的常用手段。本文提出了一种使用集成
聚类选取近天然蛋白质结构的方法,通过多次使用 K-中心点算法对候选结构进
行聚类,然后基于投票策略达成共识。并且定义了度量聚类好坏的相对密度,在
此基础上进而定义了自信分数。实验结果证明,相比于传统聚类方法,本文提出
的使用集成聚类的方法可以选出更好的近天然蛋白质结构。

关键字:蛋白质结构预测,候选结构,近天然结构,集成聚类
I
Selecting Near-native Protein Structures from Ab Initio
Models Using Ensemble Clustering
Abstract
Determining the three-dimensional structure of protein molecules is a cornerstone for many
aspects of modern biological research. Based on the comparison of protein structures, people can
classify the protein into different family and understand its evo