文档介绍:上海大学
硕士学位论文
代谢网络结构和功能的研究及其在光合作用进化分析中的应用
姓名:侯静
申请学位级别:硕士
专业:计算机软件与理论
指导教师:张武
20060201
~~⋯关键词:代谢网络;超图:图形聚类算法;模块相似度:光合作用生物圈中,光合作用是一个最重要、最基本的代谢过程,¨烫迨锹讨裰物进行光合作用的细胞器。关于叶绿体起源的问题~直以来都是生物学家们关心的热点问题,目前有代表性的研究成果是“内共生学说”。随着人类基因组计划的实施,从基因组规模代谢网络的比较研究出发,使用系统生物学手段来揭示光合作用的进化成为可能。本课题是基于浚生物学背景,使用计算机科学中的图论和图形聚类的乃法来挖掘生物体复杂代谢网络中蕴涵的结构和功能信息并进行模块相似性分析,揭示光合作用进化这一生命科学中的重大问题。首先利用现有生物数据库和文献信息收集整理叶绿体、绿硫菌、拟南芥、红藻、大肠杆菌以及八个不同种类的蓝细菌的代谢通路数据;其次利用超图构建各物种代谢网络的直观模型,通过计算全网络和与碳代谢紧密相关子网络的拓扑性能参数分析堵烫搴屠断妇代谢网络的拓扑结构;随后分别使用马尔可夫图形聚类算法和模拟退火图形聚类算法对各物利,以酶为中心的代谢网络进行模块划分并分别给出两种算法对各物种代谢网络的聚类结果;通过对结果的分析比较,结合两种算法的优点,提出对这两种算法所得结果进行进一步处理的畇算法,得到一组最优解;最后定义模块相似度评价指标,分别从物种整体间和内部模块问进行相似性分析,挖掘时绿体和蓝细菌之矧保守的功能模块,并将其别应到相应功能的代谢通路。本课题将计算机科学与生命科学有机的结合在了一起,利用计算机科学中常用的研究方法探讨生命科学中的重大问题,打破了咀往在生物信息学领域中计算机利学工作者仅停尉在算法研究、缺乏与生物学问题相结合的局限,把计算机方法与生物学问题紧密的连接在了一起,这也是生物信息学领域研究的一个重要方向。些卫嵘坠’·型K汉H搜О覬宦垡一
~一一【,彗嘶.,业ぷ顾樾托妥妥:】琲琧,琣试瑆。.綾,癮,.,,緄,琱豶琯痑秩搜鉲‘学位论立縠獂甼”發
签名:雄翩签名:遗址日肌一丛签名:麟日剥:超互原创性声明本论文使用授权说明一⋯⋯一~一一本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表或撰写过的研究成果。参与同一工作的其他同志刘本研究所做的任何贡献均己在论文中作,明确的说明并表示灰狻本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部分内容。C艿穆畚脑诮饷芎笥ψ袷卮斯娑に堕§匦托堡型蛉搜О邮垦慌苁
~一——第一章绪论生物信息学简介传统『:物学足以观察利实验为主的科学。但近年来阿灰宰筹蜃琛釰为代表的大规模、自动化实验手段的广泛应用,实验结粜堆积如耰个能¨.镄畔⒀У牟组测序中心,每天可进行力个测序反应,产生山Ⅶ々测序数据。与之相应,数据的复杂特征更具有挑浅性。现在研究人员已经认识到,基因矧研最终是展新的分析理论、方法、技术、工具,就必颈依赖计算机的信息处理。数万亿次计算的水平了。有了这一技术支撑条件,连同源于物理学、数学等的能够得以有效的管理和运行,牛物信启、学才能得以形成和发展,”。坠托坐盐坚型生传统的办法来分析理解,急需结合数学、信息科:学、计算机利学等理论和技术方法来更好地分析理解这些数据,更深入地理解生命现象。因此,年代末期以来,生物信息学应运而生,它所研究的材私巧镅У氖荩乇鹗前樗孀基因组研究而产生的数据。而它所采用的研究方法,则是从物理А⑹和并种计算技术衍生出来的。近年米铖捧数同呈指数增加,火约每个月翻~罱,【叨∶个月删一番的汁算机计算能力的增艮速度。事实上,在今天的⋯个人型的丛丛自世纪年代以来,被鉴定的基因数据和被解析的蛋白质结构的数据也摆脱了以往缓‘陧增跃的局面,达到了每两年增槐兜乃俣取2唤鋈绱耍镅要把生物学问题转化成了剥数字符号的处理问题。要解决这样的问题就必颁发生物学数据在量A与质丛有方面所提出的挑战是严峻的。事实上,在世纪年代人们划于是否应该进行人类基冈细大规模删序的争论的个重要焦点问题就是对笈2庑蛩氖蚪写ι竞褪投羘能力的评估。如今的大型汁算机的数据处坪能』经发展到每秒数亿乃至计算方法的创新和发展,基因组研究和其他牛物学研究所产牛的海量数据,才缓H搜ю徊琢
———————————————二堡■尘坠墅型坚曼卫兰出卫韭生坠吐巫旦巫兰竖业—————————~————存基因组汁划时代,生物。⒀У暮美幽人类基因幻计划实施旰蟮淖芙岜ǜ嬷校陨镄牛谩ⅰ⒕婪豶枷义:生物信启、’半’是一门交叉科’