1 / 6
文档名称:

数据挖掘在植物蛋白质组学研究中的应用.doc

格式:doc   页数:6
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘在植物蛋白质组学研究中的应用.doc

上传人:yunde113 2014/1/24 文件大小:0 KB

下载得到文件列表

数据挖掘在植物蛋白质组学研究中的应用.doc

文档介绍

文档介绍:数据挖掘在植物蛋白质组学研究中的应用
刘欢
(学号:51041300069,导师:张红锋)
摘要:数据挖掘是一个崭新的计算机应用领域,是一种从数据库中提取预测性信息的新技术。本文在介绍植物蛋白质组学研究背景的前提下,阐述了数据挖掘的原理、方法及其在植物蛋白质组学研究中取得的进展,分析了现有数据挖掘技术存在的问题,提出当前应该在确保数据质量的前提下,重视数据挖掘中系统数据分析和归纳的能力。
关键词:蛋白质组;植物蛋白质组学;数据挖掘;数据分析
2000年6月人类基因组工作框架图的完成,标志着生命科学的研究进入了后基因组时代。此时生命科学的研究重心开始从揭示生命的所有遗传信息,逐渐转移到对生命功能的整体性研究上。蛋白质组学这一新兴学科应运而生。蛋白质组学的定义是:“对一个组织、细胞、或亚细胞组分中蛋白质群的系统分析”[1]。在蛋白质组学的研究中,植物蛋白质组学的研究仍处于起步阶段。如何结合生物信息学技术,对植物蛋白质组进行系统、高效的研究,是后基因组时代功能基因组学研究的重点领域。其中特别是如何结合最新的数据挖掘技术,对提取的大量数据进行分析、综合、归纳和判断,以此来发现蛋白质组中隐藏的关系和规则,提出预测性的建议,成为了研究中的热点。
植物蛋白质组学研究的现状
植物蛋白质组学的概念、意义以及产生背景
蛋白质组(proteome)这一概念,最早由Wilkins等(1994)提出,与基因组概念有着内在的联系和区别[2]。蛋白质组学从总体上对生命的功能载体———蛋白质进行研究。蛋白质组学研究目前已迅速地在全球范围内展开。总的来说可以分为两方面,也就是蛋白质组学发展的两条路线。
作为数据库,即从细胞或组织的整体水平研究蛋白质表达的量化谱。由于蛋白质组的高度动态变化,一个蛋白质组的数据库必须包括诸多因素,例如细胞表型、状态和所使用的分析软件,翻译后修饰的量和度,亚细胞定位,以及与其它蛋白的相互作用等。
作为生物学研究的方法,或者称为功能蛋白质组学。即分析不同状态的系统与正常的蛋白质组,进行定量比较,得到某状态的特征性蛋白。通过这种方法可以帮助人们理解复杂的生物过程[3,4]。
近年来,由于双向电泳技术、蛋白质检测及定量、指纹图谱和利用质谱仪(MS)测定蛋白质序列,增加了蛋白质组学分析的敏感度及效能,蛋白质组学作为生理和遗传研究的新工具,已渗透到植物特异性组织和器官的生理过程,对生物和非生物因素的胁迫反应。尤其是在由环境因子引起基因表达的变化及叶绿体膜蛋白结构等方面取得了长足进展。生物信息学及各种基因分离方法的改进,将有助于新基因的鉴定、分离。迄今,实验室鉴定的大多数蛋白赋予了生物学功能。然而,人们更期望基于基因组学研究发现未知功能的蛋白结构,利用结构和功能的相关性方法发现蛋白未知的功能,并阐明目标蛋白质在信号转导途径中的位置,揭示植物抗病的机理。对不同生物的蛋白质组进行比较性研究,则可为研究植物的分子进化途径、探讨植物的起源等问题提供线索。蛋白质组数据库还将可能成为农药设计的路标。
植物蛋白质组学研究中的技术方法
蛋白质组学研究中的技术方法包括:双向聚丙烯酰胺凝胶电泳(2D-2PAGE),质谱分析技术(Massspectrometry,MS),双向高效柱层析,蛋白质芯片,酵母双杂交系统和数据库搜索引擎等。其中,数据库搜索