1 / 63
文档名称:

基于投影聚类的无监督表型区分算法研究与实现.pdf

格式:pdf   页数:63页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于投影聚类的无监督表型区分算法研究与实现.pdf

上传人:cxmckate1 2015/12/22 文件大小:0 KB

下载得到文件列表

基于投影聚类的无监督表型区分算法研究与实现.pdf

相关文档

文档介绍

文档介绍:引貅学位论文作者签名:≥:伽归。学位论文版权使用授权书独创性声明期:矽/,汐..口舌两年一本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。学位论文作者签名:日作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口导师签名:签字日期:
摘要基于投影聚类的无监督表型区分算法研究与实现随着人类基因组计划的顺利完成,不断积累的巨量生物学数据和快速发展的信息学技术,给后基因组时代的生物信息学研究带来了新的挑战。近年来,随着微阵列技术的快速发展,⒄罅屑际跻丫诠δ芑蜃檠а芯恐谢竦昧斯惴旱挠τ茫嗣强梢在一次实验中同时测量成千上万个基因的表达水平ü⒄罅屑际趸竦玫幕虮泶锸据称为微阵列基因表达数据U庵指咄康募际跷;虮泶锸莸氖占峁┝朔奖悖同时也给基因表达数据的挖掘提出了严峻的挑战。高通量微阵列技术与手工表型标定方式间的矛盾导致了基因表达数据的获取与表型确定间的不平衡。然而,已有的表型区分方法大多是有监督的,并且通常忽略了基因间广泛存在的相互作用,根据单个基因的独立区分能力划分样本表型,选择相关基因。本文从新的视角,基于投影聚类的思想,提出两个考虑基因间相互关系的无监督表型区分算法蚒。通过将基因表达数据转化为具有负间隔约束的序列数据,强化了基因间的相互关系,利用设计的质量函数,采用深度优先方式遍历样本穷举树,无监督地生成样本表型划分。同时采用高效的削减策略,大大提高了算法的效率。通过将提出算法与现有的以基因表达数据分析为目的的代表性投影聚类算法相比较,证明提出算法的高效性。同时,在五个真实微阵列数据上对提出算法进行验证,证明算法的有效性。本文对基因表达数据的样本表型区分问题进行了深入研究。算法采用数据挖掘的投影聚类方法对样本表型进行无监督划分,同时根据样本表型所对应的畇得到确定该样本表型的诊断基因,为疾病诊断和考察疾病的形成原因提供了一个崭新的视角。关键词:投影聚类;基因表达数据;序列数据;样本穷举树;表型划分东北大学硕士学位论文摘要一.
,,谢,甅东北大学硕士学位论文甋瑃.;琻琭瑆..也甈,,..甀甌瓸琔,琣.
—:东北大学硕士学位论文;.;;;
目录独创性声明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第滦髀邸研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究目的与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文主要工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第孪喙匮芯抗ぷ鳌聚类分析技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第驴悸腔蚣湎嗷ス叵档谋硇突炙惴ā基本概念⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯平凡子序列削减⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.┱┱⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....
.莨槭交址椒ā削减规则与优化策略⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯惴ǖ南骷跤胗呕本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第率笛榧敖峁治觥实验环境与数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯参数选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯算法的效率⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯算法的有效性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯