1 / 68
文档名称:

基于PCA的医疗数据特征提取方法研究及应用.pdf

格式:pdf   大小:4,498KB   页数:68页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于PCA的医疗数据特征提取方法研究及应用.pdf

上传人:bodkd 2021/4/9 文件大小:4.39 MB

下载得到文件列表

基于PCA的医疗数据特征提取方法研究及应用.pdf

文档介绍

文档介绍:中南大学
硕士学位论文
基于PCA的医疗数据特征提取方法研究及应用
姓名:王双维
申请学位级别:硕士
专业:计算机软件与理论
指导教师:樊晓平
20080501
摘要实现特征空间维数的压缩。本文以湖南省自然科学基金项目为背景,本文通过分析比较当前经典的特征提取技术,并分析其优缺点,在对高维数据的处理中,若不考虑数据降维的问题,会导致数据量大,计算复杂,难以提取有价值的信息等问题,因此,高维数据的特征提取是数据挖掘中重要的数据预处理问题。高维数据特征提取是从原始数据中提取对分类识别最有效的特征,以表示原始数据,从而系统研究了激光诱导自体荧光光谱数据的特征提取技术。提出了两种数据特征提取方法。首先,从统计分析角度,提出了一种基于主成分判别分析的特征提取方法,该方法克服了主成分分析中鲁棒性差、没有充分利用类别信息的问题,克服了算法的小样本问题和秩限制问题,可有效降低数据维数。其次,引入粗糙集理论,从知识发现的角度提出了基于容错关系信息熵的粗糙主成分分析方法,该方法不需要任何先验知识,可对知识进行严密分析和处理。通过实验证明,粗糙主成分分析方法不仅解决了主成分判别分析方法难以处理的信息不完备问题,而且取得了更高的分类识别率、敏感性和特异性。关键词特征提取,主成分分析,粗糙集,属性约简
州曲甀,瑃瓼.,,.甌瑆琣,,瑀甀.甀瓵琲.琤瑆痶.琣
期:型年』月旦日作者签名:三翌壅日期:槟辍辉日学位论文版权使用授权书原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特另以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。导
第一章绪论弟一早三:百下匕选题背景在信息化社会的今天,随着信息技术和互联网技术的发展,现代化的生产和科学研究产生了大量数据和重要信息.其中许多数据属于高维数据,如多媒体数的规模越来越大。这些海量数据中蕴藏着大量有价值的信息,如何高效、准确地由于这些数据兼具数据量超大及数据维数超大的特征,这就使得对它们进行象映射到低维空间中:对于低维数据的处理,已有许多可直接采用的相关高效算特征提取是模式识别研究领域的一个热点,特征提取技术在模式识别、数据以:减少数据冗余;减少输入数据的带宽,以提高计算速度,降低数据需求量;据、空间数据、时间序列数据、莸龋毕质凳澜缡菘馑娲⒑痛使用这些信息就成为当今研究的一项重要课题。各项操作运算时间过长或者超出了当前普通计算机的运算能力。而通过特征提取,可以使这些数据用较低维的特征来表示,这样就能大大地提高对这些高维海量数据的利用率。通常,对于高维数据进行快速查找的理想方法就是先把数据对法,因此如果能够用较低的维数来表示高维数据,就可以降低对数据进行存储、获取及可视化等操作的计算复杂度。正是由于以上这些需求,使得特征提取这项技术逐渐发展了起来。挖掘、机器学****目标检测、医疗诊断等领域起着非常重要的作用,同时也是亟待解决的重要问题。在模式识别中,由被识别的对象产生一组基本特征,这些特征可以是计算出来的笔侗鸲韵笫遣ㄐ位蚴滞枷袷,也可以是用仪表或传感器测量出来的笔侗鸲韵笫鞘滴锘蚰持止淌,这样产生出来的特征叫做原始特征。原始特征的数量可能很大,或者说样本处于一个高维空间中,通过映射虮浠的方法可以用低维空间来表示样本,这个过程叫做特征提取。映射后的特征叫二次特征,它们是原始特征的某种组合ǔJ窍咝宰楹。,所谓的特征提取在广义上就是指一种变换。假如遣饬靠占洌琗是特征空间,则变换篩一就口做特征提取器Ⅲ。在模式识别理论中,特征提取的一般原则是所提取的特征之间相关性越小越好,尽可能提取不相关的特征。特征提取是与索引、最近邻搜索、可视化等操作相关联的一项数据预处理操作。其目的是用较低的维数表示高位数据,并且尽可能地保持数据之间的“距离’’信息,从而大大降低对它们进行各项操作的计算复杂度。对数据进行特征提取可硕士学位论文
特征提取技术的研究现状为分类器提供适当的特征集,提高分类器的性能;用较低的维数表示数据,最大程度