1 / 16
文档名称:

支持向量机算法和软件ChemSVM介绍.doc

格式:doc   页数:16页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

支持向量机算法和软件ChemSVM介绍.doc

上传人:xxj16588 2016/3/25 文件大小:0 KB

下载得到文件列表

支持向量机算法和软件ChemSVM介绍.doc

相关文档

文档介绍

文档介绍:支持向量机算法和软件 ChemSVM 介绍本文由 longer1110 贡献 doc 文档可能在 WAP 端浏览体验不佳。建议您优先选择 TXT ,或下载源文件到本机查看。支持向量机算法和软件 ChemSVM 介绍陆文聪 1, 陈念贻 1, 叶晨洲 2, 李国正 2( 1. 上海大学化学系计算机化学研究室, 上海, 200436 )( 2. 上海交通大学图象及模式识别研究所,上海, 200030 ) 摘要 Vladimir N. Vapnik 等提出的统计学****理论( statistical learning theory ,简称 SLT )和支持向量机( support vector machine ,简称 SVM )算法已取得令人鼓舞的研究成果。本文旨在对这一新理论和新算法的原理作一介绍,并展望这一计算机学界的新成果在化学化工领域的应用前景。“ ChemSVM ”软件提供了通用的支持向量机算法,并将其与数据库、知识库、原子参数及其它数据挖掘方法有机地集成起来。关键词模式识别; 支持向量机; 支持向量分类; 支持向量回归中图分类号:中图分类号: O 06-04 Introduction to the Algorithm of Support Vector Machine and the Software ChemSVM LU Wen-cong1, CHEN Nian-yi1, YE Chen-zhou2, LI Guo-zheng2 (1. Laboratory of Chemical Data Mining, Department of Chemistry, Shanghai University, Shanghai, 200436, China) (2. Institute of Image and Pattern Recognition, Jiaotong University, Shanghai, 200030, China) Abstracts: The great achievements have been approached in the development of statistical learning theory (STL) and support vector machine (SVM) as well as kernel techniques. This paper aimed at introducing the principle of SLT and SVM algorithm and prospecting their applications in the fields of chemistry and chemical industry.. Key Words: Statistical learning theory, Support vector machine, Support vector classification, Support vector regression 众所周知, 统计模式识别、线性或非线性回归以及人工神经网络等方法是数据挖掘的有效工具,已随着计算机硬件和软件技术的发展得到了广泛的应用[1-4] , 我们亦曾将若干数据挖掘方法用于材料设计和药物构效关系的研究[5-12] 。但多年来我们也受制于一个难题: 传统的模式识别或人工神经网络方法都要求有较多的训练样本, 而许多实际课题中已知样本较少。对于小样本集, 训练结果最好的模型不一定是预报能力最好的模型。因此,如何从小样本集出发,得到预报(推广)能力较好的模型,遂成为模式识别研究领域内的一个难点, 即所谓“小样本难题”。最近我们注意到: 数学家 Vladimir N. Vapnik 等通过三十余年的严格的数学理论研究,提出来的统计学****理论( statistical learning theory , 简称 SLT ) [13] 和支持向量机( support vector machine ,简称 SVM )算法已得到国际数据挖掘学术界的重视, 并在语音识别[14] 、文字识别[15] 、药物设计[16] 、组合化学[17] 、时间序列预测[18] 等研究领域得到成功应用, 该新方法从严格的数学理论出发, 论证和实现了在小样本情况下能最大限度地提高预报可靠性的方法,其研究成果令人鼓舞。张学工、杨杰等率先将有关研究成果引入国内计算机学界, 并开展了 SVM 算法及其应用研究[19] ,但国内化学化工领域内尚未见 SVM 的应用报道。收稿日期: 2002-06-10 ;修回日期: 2002-09-10 资金资助:国家自然科学基金委和美国福特公司联合资助, 批准号: 9716214 作者简介:陆文聪( 1964 —)