1 / 67
文档名称:

微阵列数据的聚类算法研究.pdf.pdf

格式:pdf   页数:67页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

微阵列数据的聚类算法研究.pdf.pdf

上传人:755273190 2015/11/3 文件大小:0 KB

下载得到文件列表

微阵列数据的聚类算法研究.pdf.pdf

相关文档

文档介绍

文档介绍:知识水坝为您提供优质论文
知识水坝为您提供优质论文
西北大学硕士学位论文分类号:——密级:——盐簋垫圭鳢鱼墨途熬撞——:学号:鲤
知识水坝为您提供优质论文
摘要缀。闍皴薄捌技零《婆霹嚣溅量全蒸霹缝弱表达壤嚣,楚生蘩学家歆谖鏊瓣深入。研究基因在不同时间和条件下的淡达情况,是认识基因功能的一个主要途的重要工具。微阵列技术产生了大量基融表达数据,要从中摄取有价值的信慧,集到一起,这种划分有助于专业人员发现基因功能和遗传模式。例如均值和自组织映射都需要预先输入簇的个数,而在对基因表达谱进行聚类瓣,簇麓令数逶鬻怒未知麓,改交这一参数往往会较大戆影晌聚类结采;簧绞豹聚类算法对噪声数据非常敏感,对规模的可伸缩性差;传统聚类算法最早是起源自非生物相关的研究邻域,所以通常的聚类结果并不包含明确的生物学意义。本文针对以上不足,将罱谙任账枷牒鸵阎;虻纳镅еJ兑肓嘶诿缓瓣聚类算法孛,设诗并实瑗了一耱藏熬基予密度豹啾芰谙扰1>劾辔法,在聚类过程中幂珏掰己知基因的生物学意义生成最初静簇燕。最后将所提蹬的性和生物学上的意义两方面给出了明确的比较,从对比结果知本文所提出的算法无论扶簇结构躲含溅瞧还是生物学意义上帮臻显高于均馕聚类葵法。关键词:徽阵列蘩瓣表达数据聚类分析罱诨诿芏随着人类基因级计划的进展,对于熬因的功能和基因组内各基因的研究遂步采用数据挖掘的技术是十分必要的。功能相近的基因其表达模式相似,通过发现相似的表达模式可以预测未知潦强戆功能。数据挖熬中数聚类算法楚按照数据戆稳奚嘈蟹郑佃ノ镆岳嗑静愚想。采矮聚类技术对基因表达数爨避行处理,可班把袭糯摸式相近的基潮聚目前基因芯片邻域中的大多数聚类磐法在实际应用中存在着一些不足之处,算法应用于酵母细胞有丝分裂下的基因芯片数据,对聚类的结果从簇结构的台瑕露大学殒圭骚究堡谂囊
知识水坝为您提供优质论文
甅篗籫甀痵.;;,痜—....,痶瑆.;西北大学硕士研究生论文
知识水坝为您提供优质论文
聊晔吕呷瘴鹁伞文学位论文作者签名:多噬学位论文作者签名:多馒多月刃日西北大学学位论文知识产权声明书西北大学学位论文独创性声明≯∞月本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属于西北大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为西北大学。保密论文待解密后适用本声明。指导教师签名:本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名签字日期:年月
知识水坝为您提供优质论文
第一章绪论§课题背景作,人类基因组约罨缘牟庑蚬ぷ饕步咏瓿伞V月日,被誉术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后芋莸脑龀そǜ>H恕;贒序列测序所建立起来的菘猓年美国科学家率先提出了人类基因组计划,旨在阐明人类基因组亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我【”。自从美国启动人类基因组计划以来,人类基因组和其它生物基因组的测序工作进展极为迅速。迄今为止已完成了约多种生物的全基因组测序工为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰辛努力,终于完成了工作草图,这是人类科学史上又一个里程碑式的事件。它预示着完***类基因组计划已经指日可待。随着人类基因组草图的完成,生物学资料象洪流一样滚滚而来,截止目前,仅记录在美国菘庵械腄序列总量已超过亿碱基对,数据量以几何级数的速度扩容。等人”过分析认为,目前生物学数据库中存贮的数据每~个月增加一倍,其增长速度比著名的摩尔定律还快鲈隆T谌死嗷蜃榧苹泄讨兴燮鹄吹募其中的记录已达数百万条,在这些数据基础上派生、整理出来的数据库已达余个【扪。数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从数据中挖掘信息和知识。与正在以指数方式增长的生物学数据相比,人类相关知识的增长却十分缓慢,所以当务之急是采用精确有效的方法从这些数据中提取生物学的联系,给基因分派功能并揭示生物遗传方式。一方面是巨量的数据,另一方面是为帮助人们改善其生存环境和提高生活质量