文档介绍:午醮蟆ぞ硕士学位论文论文题目.⋯⋯.⋯⋯⋯⋯。方洼研窕⋯⋯⋯⋯⋯⋯一学科、专业:⋯⋯⋯⋯⋯金析倦鲎⋯⋯⋯⋯⋯⋯。研究生姓名:⋯⋯⋯⋯⋯~至⋯⋯釜⋯⋯⋯⋯⋯⋯。专业技术职务⋯⋯⋯⋯兼逸萱⋯.熬攮⋯⋯⋯⋯⋯导师姓名及分类号⋯⋯⋯⋯⋯密级⋯⋯⋯⋯⋯.编号⋯⋯⋯⋯⋯,
\
圣为导师签名:一级掌冢荷弦的辍I显隆K咳量鲞原创性声明边年—羔月—啦日关于学位论文使用授权说明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。论文主要是自己的研究所得,除了已注明的地本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其他手段保存学位论文;学校可根据国家或湖南省有关部门的规定,送交学位论文。对以上规定中的任何一项,本人表示同意,并愿意提供使用。方外,不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献,已在论文的致谢语中作了说明。作者签名:日期:
’’——————————————————一
摘要关键词:模型聚类分析法,无信息变量消除法,单变量选择方法,多变量选择近年来,随着⒄罅屑际醯难该头⒄梗舜罅炕虮泶锲资荩并被广泛应用于癌症的诊断与分型。⒄罅屑际蹩梢栽谝淮问笛橹屑锹荚不同样本条件下成千上万的基因表达数据。面对如此庞大的数据矩阵,生物信息学方法如:聚类分析,判别分析以及回归分析等方法被用来解析及挖掘数据中所蕴含的知识。由于基因表达数据本身所特有的小样本,高维性特点,要求在建立模型之前首先对数据进行变量挑选,本文主要对不同的变量选择方法进行了研究以及比较,并提出了一种新的变量选择方法,具体内容为:诨谀P途劾喾治龇以及无信息变量消除法幕∩希文提出了一种新的变量选择方法,⒔庵址椒ㄓ胫С窒蛄炕嘟岷稀不仅解决了常见的变量选择方法难以克服的模型稳定性问题,并且更为科学的以噪音变量为参照标准来划分变量,而不是常见的人为划分。该方法的核心在于使用添加的噪音变量的重要性分布作为参照标准来评估每一个基因变量,将所有变量分为三大类,分别为:有信息变量,无信息变量胍以及干扰变量。与传统的变量选择方法只能鉴定出有信息变量以及噪音的特点相比,鞘状伪媸冻隼炊阅P偷影响比噪音更差的一类变量,即干扰变量。结合有信息变量以及干扰变量,更能全面了解疾病的病理途径,对癌症的准确诊断与分型带来可能。本文采用了两个公开发表的癌症数据约癊床馐訬的运行效果,结果显示经由秆〕隼吹挠行畔⒈淞靠梢韵灾岣吣P偷脑げ庾既仿剩且恢纸好的变量选择方法。疚拇右韵氯龇矫娼徊蕉訬算法进行了分析:员萉的氤<牡ケ淞垦≡穹椒ǎ纾篜相关系数法、秩相关系数法,结果表明,腘与单变量选择方法在不同的数据上具有不同的一致性程度,且腘筛选出的变量优于其他单变量选择方法;员腘与最优的⑾终饬街痔跫录扑愠龅谋淞恐匾性值具有较大差异,且最优堤跫律秆〕龅谋淞磕芟灾岣吣P驮げ庾既率,表明变量与变量之间的相互作用对最终挑选出的有信息变量影响非常大;对比肫渌亩啾淞垦≡穹椒ǎ纾夯谛蛄星跋蜓≡竦谋淞垦≡穹椒约暗卣飨,留一交叉验证结果表明哂薪锨康木争能力,是一种较好的变量选择方法替代法。方法,⒄罅屑际硕士毕业论文
.痯,晰,籺甒ⅱ鬷籺,籺瑆硕士毕业论文甌瑅印瑃瓺,.發瑂甀,,瓸,.琻琣:瑄甌甀珻瑂琣仃.
.:琈硕士毕业论文甌瑂.,珼
目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⒄罅屑际跤牖虮泶锸荨璴⒄⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.合成点样法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...基因表达数据特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.模式识别方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.淞垦≡⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..基于模型聚类分析谋淞垦≡⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...斜鸱治龌▆南咝耘斜鸱治觥璴姆窍咝耘斜鸱治觥本论文主要工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.≡穹椒ā弓浴理论和方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⒈⋯⋯⋯⋯