1 / 54
文档名称:

基于svm-rfe的特征选择方法研究.pdf

格式:pdf   大小:3,896KB   页数:54页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于svm-rfe的特征选择方法研究.pdf

上传人:rovend 2021/4/9 文件大小:3.80 MB

下载得到文件列表

基于svm-rfe的特征选择方法研究.pdf

文档介绍

文档介绍:万方数据
硕士学位论文基于甊的特征选择方法研究大连理工大学星墨生墨旦学完成日期:
万方数据
学位论文题目:望重三丛二匪西篮幽左丛至叠塑疆日期:艽裕辍!暝耲殳日弛大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,若有不实之处,本人愿意承担相关法律责任。作者签名:
万方数据
摘要随着人类科技的进步发展和先进仪器设备的应用,人类得到了大量的数据。其中,高维小样本数据作为生物信息数据的特点,给数据信息处理带来了新的挑战。为了从海特征,达到“去伪存真”的目的。虽然会丢失一些特征的信息,但却使被选择的特征更能代表问题的本质。甊是一种性能良好,泛化能力强的特征选择方法,它是与后项搜索策略的结合。本文研究了暮笙蛩阉鞴桃郧蟾慕T诿看蔚境一定几率重新加回当前特征子集。越早被删除的特征,被重新考察的机会越大。另外,在“最优’’特征子集搜索过程中,在当前特征子集与“最优”特征子集准确率持平时,使用互信息分别重新评价两者与类标间的关系,选择关系大的特征子集作为当前搜索到理高维生物信息样本时,去除问题无关和冗余特征,选择区分反映不同类别的生物样本的特征,寻找相互关联的特征,有助于排除噪音干扰,反映问题的实质。变量重叠度可以处理特征在各类样本上分布重叠的问题,去除噪音变量和无关变量。变量关系得分考察变量之间的相互作用,发掘变量之间相互关联。本文考虑上述因素,使用变量卣实验结果表明,基于相关性度量选择的特征子集,多角度综合评价特征得分的方法都改善了特征选择性能。关键词:甊;模拟退火;相关性;恢氐量数据中提取有价值的信息,数据挖掘技术应运而生。数据挖掘是一个广义的定义,吸纳了诸如统计学、机器学****模式识别等技术。作为数据挖掘技术之一的特征选择技术,被广泛应用于生物数据处理等各个领域。特征选择技术旨在去除噪音、冗余特征,挑选问题相关及具有良好区分类别能力的过程中,使用模拟退火策略,结合皮尔森相关系数作为度量标准,重新评估当前被删除的特征子集与当前剩余特征子集之间的关系,试图找回不相关的、非冗余特征,使其有的“最优”特征子集。随着分析技术的发展,基因、蛋白等生物数据维数巨增,其中既存在噪音和不含问题相关信息的无关变量,也存在相互关联的特征,共同表征复杂的生命现象。因此在处重叠度、变量关系得分,结合特征在超平面上的ㄖ兀餐纬商卣鞯淖酆掀兰得分,有助于确定反映不同种类疾病、药物疗效等的标志信息。大连理工大学硕士学位论文
万方数据
嘶甌甌.猂,基于奶卣餮≡穹椒ㄑ芯.,瞖琲瑀.猂甒,琣琣,甀,甀也瑆,..,琲琣,.琤疭,瑃瑃瑂,.。瑆一—
万方数据
篠—籗大连理工大学硕士学位论文,琣籆;籓.
万方数据
目录绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据标准化和缺失值处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯特征选择和特征提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.罱诜椒ā.霾呤鞣椒ā多类问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于支持向量机的递归特征消除方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.模拟退火方法与相关性度量⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.互信息考察特征集合⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..笛榻峁疤致邸.卣餮≡穹治觥本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.重叠区域权值考察特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.数据挖掘产生的背景及特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据挖掘在现代领域的应用及挑战⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本文的主要工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯萃诰蛑械南喙丶际酢.卣餮≡瘛.卣魈崛 分类技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯可视化技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.谙喙匦远攘亢蚐.奶卣餮≡穹椒–.甊方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.甊的实验设置和结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.菁枋龊筒问瓒ā.酆咸卣髌兰鄣奶卣餮≡穹椒ā多重角度的特征评价方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于奶卣餮≡穹椒ㄑ芯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯..
万方数据
对变量关系评价方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.