1 / 65
文档名称:

基因微阵列数据特征选择与分类方法研究-计算机应用技术专业论文.docx

格式:docx   大小:506KB   页数:65页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因微阵列数据特征选择与分类方法研究-计算机应用技术专业论文.docx

上传人:wz_198613 2019/1/13 文件大小:506 KB

下载得到文件列表

基因微阵列数据特征选择与分类方法研究-计算机应用技术专业论文.docx

文档介绍

文档介绍:AThesisSubmittedinFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchonGeneSelectionandClassificationofDNAMicroarrayDataSubmittedbyHuangDan-fengSupervisedbyProfessorQiYun-songJiangsuUniversityofScienceandTechnologyMarch,2012江苏科技大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:年 月 日江苏科技大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权江苏科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于:(1)保密□,在 年解密后适用本授权书。(2)不保密□。学位论文作者签名: 指导教师签名:年 月 日 年 月 日摘 要DNA微阵列又称基因芯片,是二十世纪九十年代发展起来的具有里程碑意义的生物学技术,通过对不同样本(时间、环境等)下的基因表达模式进行分析可提取重要信息。至今为止,该技术已经在基因发现、疾病诊断、药物发掘、药理研究等多个领域得到广泛应用并有着光辉的发展前景。目前,科学家们正积极结合多学科知识工具来提取基因表达数据中所包含的生物学意义。鉴于实验环境及成本的限制,DNA微阵列数据具有高维小样本,存在冗余基因与噪声基因等特点,如何高效准确地从DNA微阵列数据中发掘有用的信息,是当前机器学****和数据挖掘领域亟待解决的问题之一。成功的特征选择和分类算法是微阵列数据分析的关键,本文围绕基因表达数据的特征选择和分类任务展开研究,主要研究成果如下:,其主要思想是显著性较高的特征能划分较多的不同类,聚集较多的同类样本。,将基于类可分性判据的算法用于DNA微阵列数据分析,对原信息系统构造相似矩阵和新信息系统来选择特征基因组,避开了离散化过程,减少了信息损失。,一对一支持向量机等现有多类分类方法,分析了它们在解决多类问题时的优缺点。,提出了一种基于二叉树结构的支持向量机多类分类器,使用参数方式调整样本分布范围与类间距离权重,据此调整二叉树结构。论文利用研究成果针对人脑肿瘤,白血病等多个数据集进行了基因选择和分类实验。实验表明,采用论文研究的方法进行DNA微阵列数据基因选择和分类,分类准确度和效率都具有较大优势。关键词DNA微阵列;特征选择;粗糙集;分辨矩阵;支持向量机;多类分类AbstractDNAmicroarray,alsocalledgenechip,echnologydevelopedsince90s’twentycentury,whichcouldanalyzethemodeofgeneexpressionfromdifferentsamples(time,atmosphere,etc),thetechnologyhasbeenwidelyappliedingenediscovery,diseasediagnosis,drugdiscovery,toxicologyresearch,etc,,,DNAmicroarraydataischaracterizedwithhighdimensional,smallsamples,bignoise,largenumberofredundantgenes,uratelytofindusefulinformationfromDNAmicroarraydataison