1 / 12
文档名称:

基于潜在语义分析的中药分类技术.doc

格式:doc   大小:33KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于潜在语义分析的中药分类技术.doc

上传人:小泥巴 2021/4/30 文件大小:33 KB

下载得到文件列表

基于潜在语义分析的中药分类技术.doc

相关文档

文档介绍

文档介绍:基于潜在语义分析的中药分类技术
  摘要:中医理论现代化是中医发展过程中的关键问题,但中医概念过于模糊,缺乏精确定义,以致难以进行技术验证。迄今,中药分类方法不为西方医学所承认,鉴于中药成分的多样性和复杂性,难以用生物化学方法逐一对中药分子成分进行分离、药效验证并分类。为验证中药分类的科学性,将药物的分子特性转换到光谱中进行研究,结合互联网搜索引擎采用的潜在语义分析技术结合加权方法,对滋阴、壮阳、补气和补血4类中药共48种药材的近红外光谱数据进行研究,分类结果与中药分类近似。
  关键词:中药;潜在语义;近红外光谱
  DOI:.1005-
  中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2015)03-0005-05
  中医现代化需要采用科学技术手段检验中医的理论,但相关概念缺乏清晰的定义,许多信息无法用语言传递,也无法运用现代实验手段进行验证,因此,中医现代化过程中遇到很多困难。要将中医的概念清晰化、理论实体化是中医发展过程中需要解决的关键问题。如滋阴壮阳药物究竟依据何种生理指标进行划分,没有精确说明,无法为实验所验证,因此,这种药物的分类方法不为西方医学所承认。但随着信息科学和计算机技术的发展,可以采用相应技术手段提取这些类别中药的共同特征,明确分类的客观依据,以说明中药分类的科学性。
  1 中药分类相关研究
  探究中药分类的科学依据是中医药研究的热点之一。部分研究集中于分析中药药效的物质基础,如蛋白质、糖类、脂类、微量元素等物质与药效的关系,尤以微量元素研究居多。胡氏等[1]将56味药材分成清热解毒药、辛凉解表药和利水渗湿药3类,应用线性判别方法分析32种微量元素含量和类别的关系,获得了比较高的准确率。高氏[2]针对20种植物药,使用主成分分析(PCA)结合神经网络,建立了钙、锰、铜、锌等4种微量元素含量与中药材清热解毒类、活血化瘀类和止血类药物之间的关系,并对测试集中的3组数据进行划分。但微量元素只是中药效用物质中的极少部分,对非微量元素和功效的研究还相对缺乏。另外,还有一类研究中药的功效描述归类问题。彭氏等[3]使用神经网络分析中药复方功效,将中药脾胃类药方库对应约700余种药物的相对剂量为输入,输出为专家整理的133种不同功效,采用属性归约算法(SARM),实现了中药方剂功效的分析系统。有报道对中药药性理论相关基础问题进行深入研究,选择常用的1725种药物,将微凉、凉、微寒、寒、大寒等1067种药物归入寒性,将微温、温、热、大热等658种药物均归入热性,根据主治功效对药材进行寒热分类[4-5]。这些研究有一定意义,但缺乏客观依据作为药效的分类基础。
  药物之所以有效,是因为药物分子基团具备特定空间构型,而不同构型的分子基团对光具有不同的特征吸收频率,我们可以把分子基团的结构特征转换到光谱中进行研究。近红外光谱分析技术可以获得中药功能基团化学结构的有关信息,Chen等[6]建立了预测甘草中指标性成分浓度的光谱校正模型;另有研究对三七中有效成分及总皂苷[7-8]、冬虫夏草中甘露醇[9]、氨基酸[10]及黄连中生物碱[11]进行了含量测定,均得到了准确结果。杨氏等[12]选用分光光度法对银杏叶样品中黄***类化合物进行分析,利用定量分析中的自动优化功能选择出最佳谱图区、最佳光谱预处理方法及最佳主要成分维数,,预测误差相对较小。范氏等[13]以高效液相色谱法测定了3个不同产地大黄中大黄素、大黄酚、大黄酸、芦荟大黄素的含量,并用41个样品建立近红外光谱模型,用于预测大黄样品中大黄素、大黄酸、芦荟大黄素等主要活性成分的含量,并与高效液相色谱法测定结果相比较,。叶氏等[14]采用傅立叶变换红外光谱法分析了国家药典中5种***羊藿的质量,获得满意结果。
  但由于中草药含有包括纤维素和水分等许多共同物质,光谱相似性很高,多种药物光谱之间会产生严重重叠,经典的聚类算法很难将不同药物区分开,更难准确分类。运用各种智能算法通过训练虽然可以对中药的光谱进行分类,但缺乏直观的分类依据。近红外光谱结合潜在语义分析(LSA)的聚类分析技术,可以较好地完成滋阴、壮阳、补气、补血类中药的分类。
  2 基于潜在语义分析的分类技术
  LSA是互联网搜索引擎中广泛使用的成熟技术,能提取词与词之间潜在的语义关系,并把每个文档视为以词汇为维度的空间中的点,通过奇异值分解压缩搜索空间,根据词语的语义相关性将文档聚类,检索速度快,查询精度高。在化学成分未完全明了的情况下,应用近红外光谱分析技术对中药进行分析,通过吸收峰的位置和强度间接反映中药的化学