文档介绍:作者姓名 熊 娓 论文分类号 TP39
保密级别 公 开 研究生学号 2003532192
学位类别 硕 士 授予学位单位 吉 林 大 学
计算机应用 培养单位 吉林大学计算机科
专业名称
技术 (院、所、中心) 学与技术学院
2003 年 9 月
研究方向 计算智能 学****时间
至 2006 年 6 月
基于 SVM 和 GA 混合算法的基因芯片
论文中文题目
特征基因子集选取研究
Study on Selection for Feature Gene Subset
论文英文题目 in Microarray Expression Profiles Based on
a SVM and GA Hybrid Algorithm
关键词(3-8 个) 基因芯片,特征选择,支持向量机,遗传算法
姓 名 梁艳春 职称 教授
导师情况
学历学位 博士 工作单位 吉林大学
论文提交日期 2006 年4月30日 答辩日期 2006 年 月 日
国家自然科学基金
是否基金资助 基金类别
是 重点项目
项目 及编号
(60433020)
如已经出版,请填写以下内容
出版地(城市
出版者(机构)名称
名、省名)
出版日期 出版者地址(包括邮编)
内容提要
基因芯片是生物信息学领域迅速发展起来的一项高新技术。基因芯
片的出现为基因诊断和基因治疗提供了很好的前提条件和可能性。对基
因芯片技术的实际应用是通过对实验所获得的表达谱数据集进行分析研
究来实现的。
基因芯片表达谱数据特征基因子集选取问题是基因芯片技术的挑战
性课题之一。本文在算法上主要研究了一种基于 SVM 和 GA 混合算法的基
因芯片数据特征基因子集选取方法。首先利用最小二乘支持向量机分类
器按照基因的一定的显著性水平,通过计算基因的重要程度,并根据分
类准确度提取出包含若干特征基因的子集,滤掉大部分与疾病类别无关
的基因。然后采用改进的遗传算法,根据所选特征对分类的贡献程度对初
选的特征基因做进一步特征基因的选择。最后,利用支持向量机作为外部
分类器对所选的特征基因子集进行评价。 本文将算法用于基因芯片技术
的两个公认的数据集,做了实际测试,对选出的不同子集大小、不同遗
传终止代数、不同特征基因个数下的结果分别进行了评价并与其他已有
应用的算法的实验效果进行了对比,取得了较好的效果。
关键词:基因芯片,特征选择,支持向量机,遗传算法
目 录
第一章 绪 论............................................. 1
§ 基因芯片简介 ........................................ 1
基因芯片的研究意义 ................................. 1
基因芯片的主要类型 ................................. 2
基因芯片的数