1 / 109
文档名称:

基于DNA微阵列基因表达谱数据的癌症检测研究.pdf

格式:pdf   大小:3,920KB   页数:109页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于DNA微阵列基因表达谱数据的癌症检测研究.pdf

上传人:rovend 2021/9/6 文件大小:3.83 MB

下载得到文件列表

基于DNA微阵列基因表达谱数据的癌症检测研究.pdf

文档介绍

文档介绍:博б敛孜
摘要
癌症治疗面临的重大挑战是如何针对病原上各自独特的癌症类型制定具体的
治疗方法,以达到最大疗效的同时降低药物的副作用。因此,癌症检测或癌症分
类成为癌症治疗的中心环节。一直以来,癌症检测主要基于肿瘤的形态表观,但
这种检测方式有很大的局限性,因为具有相似组织病理学表观的肿瘤可能表现出
很不相同的临床发展过程,或者对同种治疗呈现出不同反应。近年来,⒄
列技术的发展产生了海量的基因表达谱数据,为寻找基因之间表达调控的复杂关
系网络,研究功能基因组和癌症检测提供依据。目前,利用基因表达谱进行癌
症检测成为癌症研究的重点之一。但是基因表达谱数据具有高维性,高噪声,
高冗余,数据分布不均衡等特点,对基因数据分析方法提出了更高要求,对基
于⒄罅谢虮泶锲椎陌┲⒓觳獯戳颂粽健
本论文从基因表达谱数据的分析着手,以挖掘基因表达模式和癌症检测研究
为主要目标,研究癌症检测中基因表达数据的预处理、特征基因的选取、癌症组
基因表达模式的分析以及建立合适的基因诊断模型的问题。本文的主要工作归纳
如下:
第一,针对基因表达数据的特点,提出一种基于聚类方法的分步的特
征基因选择方法,然后,在分步的特征基因选择方法中引入“ 崩
论,以确定特征基因数目,提出一种自适应的特征基因的选择方法,弥补目前的
特征基因选择算法中缺乏较好的基因数目预置机制的不足。
第二,利用主分量分析方法投懒⒎至糠治龇椒挖掘基因
表达谱中隐含的基因表达模式,揭示癌症中基因的调控机制,通过抽样来选取特
征基因子集以减少噪声对和的影响,并且根据基因子集中隐含模式的
相似性来重构基因表达,提出一种基于隐含变量模型的癌症检测算法。
第三,利用癌症组基因表达存在的局部特征相关性的生物病理特点,提
出⒄罅谢虮泶锲字邪┲⒆楣亓?占涞母拍睿槿〔煌┲⒆榛诠亓?
间的基因特征模式,研究与癌症组相关联的基因表达模式在癌症组中的表达以及
调控,并提出适合癌症组相关联的基因表达模式的癌症预测算法,有效缓解基因
数据集中“维数灾难”的问题。
第四,由于不同的特征选择方法采用不同的搜索机制和评价策略,挑选出的
特征基因偏向癌症特征的不同方面,因此不同方法选择的特征基因明显不同,导
致分类器的识别结果不稳定。针对癌症组基因数据和基因组数据构建一组具有互
补性分类器,提出一种组合分类算法提高癌症分类算法的泛化性能。
萆十儆辨别苹嘲发迓谱数掘,姿氡郧啦庋芯
第五,从基因之间的协同表达来分析基因数据,研究具有可解释的基因表达
模式。在显现模式的提取中增加虚拟样本以挖掘具有更高辨识能力的显现模式,
并在候选分割点选择策略中通过高斯分布来模拟分割点的分布,提高分割点选择
的可靠性,然后提出两种基于显现模式的癌症检测算法。
关键词:⒄罅校换虮泶锲祝话┲⒓觳猓惶卣骰颍换虻骺兀换虮
达模式
第滦髀
在多年的癌症膊研究中,科学家和医学工作者们认识到,癌症并不只
是某一种疾病,在它的背后,隐藏着形形色色,变化多端的种类,存在着几百种
这样的癌症。它们为什么一直难以攻克呢渲饕5脑蚴怯捎诿恳恢职┲⒍加
自己的特点,一种药物并不能对各个不同组织的癌症都能产生疗效,有些能抑制
住肿瘤细胞,但有些却毫无作用,甚至在病症上相同的癌症,也无法用一种药物
达到治疗的目的。随着人类生命科学的发展,人们对于基因这一有关人类生长、
发育、衰老、遗传的最重要和最本质的因素,有了新的认识,并逐渐开始将基因
引入对疾病的诊断、治疗、药物研制、药物筛选等方面。因此,基因诊断、基因
治疗,药物基因组图等应运而生。通过基因进行疾病诊治是对传统诊治方法提出
的巨大挑战,成为人们关注的焦点。
世纪年代初开始实施的人类基因组计划 琀
与世纪年代制定的曼哈顿***计划