1 / 7
文档名称:

SVM方法在《伤寒论》方小样本分类识别中的应用.doc

格式:doc   页数:7
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SVM方法在《伤寒论》方小样本分类识别中的应用.doc

上传人:豆芽 2014/2/3 文件大小:0 KB

下载得到文件列表

SVM方法在《伤寒论》方小样本分类识别中的应用.doc

文档介绍

文档介绍:SVM方法在《伤寒论》方小样本分类识别中的应用
(作者:___________单位: ___________邮编: ___________)
作者:孙燕,臧传新,任廷革,刘晓峰,张帆
【关键词】支持向量机;《伤寒论》;分类识别
支持向量机(Support Vector Machine,SVM),到90年代中期,这一理论才开始受到越来越广泛的重视,并且这一新的理论方法在解决模式识别中小样本、非线性及高维识别问题中表现出独特的优势和良好的应用前景[1]。对于SVM方法用于分类研究的高效性和准确率,国外有人已经将其与16种已有的分类方法进行了比较,得出SVM方法最优的结论[2]。目前该方法已在很多领域得到了广泛应用,如人脸检测[3]、文本自动分类[4]、生物信息学[5]、医疗诊断[6]等等。笔者针对《伤寒论》类方小样本分类识别问题,对该方法进行了初步实验,结果表明该方法具有较好的识别性能。
1 构造SVM 建模因子
本实验中的样本资料来自经典的《伤寒论》。建模的主要构造因子为:药物名称、药物剂量、处方的综和性味归经、功效强度、主治证候、处方针对的临床表现等1 360多个。为避免人为判断因素的干扰,每个因子尽量以数字化形式来描述,各建模因子的数值直接由中医处方智能分析系统[7]通过基于模型计算的方式直接输出。为了避免各个因子之间的量级差异,对其进行了归一化处理,使每一因子的数据落入区间[0,1],对样本中不存在的因子直接赋值为零。
实验采用的CMSVM[8]机器学习系统是由陈永义教授为主的CMSVM开发小组研制开发的。该系统采用的是Thorsten Joachims的快速SVM算法,在保留了SVMLight(http://www. kernel-)内核的基础上扩展、开发了一个参数优化、仿真及数据分析的辅助软件,可以按设定的区间和步长自动运行训练,并把有用的运行结果单独生成数据文件,方便进一步对结果进行分析。这样,通过减少人为参与,实现了计算机自动选择最优模型的功能,提高了选择最优模型的效率。
将SVM方法应用于《伤寒论》方分类识别的原理是根据历史对已知处方的分类情况进行训练建模产生学习机,用此学习机来识别未知的样本数据。具体做法是将《伤寒论》中的所有方证样本资料进行整理,并将其分为两部分:验证文件、检验文件。验证文件包含用于训练建模的训练集样本和实验集样本。建立检验文件是为了将最终确立的SVM预报模型对其做预报,以检验SVM模型的预测效果(推广能力),检验集的数据不参与训练学习及参数筛选等建模过程。
2 SVM方法对《伤寒论》方按八法训练建模分类实验
训练样本不变,选取不同参数对建立SVM模型的影响
随机选取《伤寒论》方中传统上按照八法分类法归为汗法的方证26首确定为正样本,其余主要归为下法的处方23个,共49个样本数据作为验证文件的训练建模样本。训练样本的因子都是处方的药物、性味归经、功效、适应证,然后从剩余未参与训练建模的处方中选取一部分数据作为预测文件来检验所建模型的泛化能力。见表1、表2。表1 选取不同参数建立的SVM最优模型(略)表2 最优模型的泛化能力比较(略)
从上面的分析结果可以看出,在样本数比较小的情况下,参数