文档介绍:基于方剂数据挖掘的证候要素间关联规律的研究
作者:汤尔群,任廷革,刘晓峰,张帆,孙燕
【关键词】证候要素;数据挖掘;方剂数据库
“证候要素”是中医辨证的基本要素,是辨证体系的核心内容[1],对“证候要素”的研究是目前辨证论治研究的一个新热点。本研究以古代方剂文献中所蕴含的“证候要素”为研究对象,以“证候要素”间关系的发现为目标,进行数据挖掘,探讨不同证候要素间关联的某些规律。这一实践对辨证论治新体系[1]的研究有重要意义,可在为中医“证候”深入研究提供历史数据依据的同时,通过对研究结果的评价,探讨这一研究方法对辨证论治体系研究的有效性。
目前一些学者研究认为,“证候要素”主要指辨证所需确定的“病位”和“病性”[2],其中“病性”是由病因、病机归纳而得。我们沿用这一思路设计出实验研究的方案,即利用方剂数据库的资源,从历史方剂文献的角度,以某些“病位”为观察对象,去发现与其他“病位”及“病因”、“病机”间的关联关系。
1 方剂数据库简介
北京中医药大学研制的古代方剂数据库(以下简称“方剂库”)采用全文解析、主题标引的技术方案,目前已收录73种古代中医文献中所有方剂文献,覆盖了历史上绝大部分方书所记载的方剂内容,年代跨度在2 000年以上,共计92 102条记录。在对方剂文献进行全文收录的基础上,对方剂来源、主治、组成、服用法等33项内容进行了解析,且对方剂文献中记载的病名、病因、病位、病机、立法、证候、症状等内容进行了主题标引,并完成了数据高度的结构化存储,为历史文献信息的充分释放创造了条件,实现了对文献中
“证候要素”的提取,成为证候要素间关系挖掘的先决条件。
这样建设起来的方剂库,实现了多角度的查询功能,加上整套查询逻辑语言的帮助,优先级干预方法的设置,树状结构“主题词表”的利用,二次查询的设计等,使方剂库在同类项目中具有明显的查询优势,可以满足复杂的逻辑查询的需求,明显提高了数据的查检率和准确率。对于查询所得的结果,除了一般的结果显示,还可以对方剂的功效、用药、病名、病因、病机、病位、症状体征等内容进行统计及关联分析,并通过主题词表的结构对统计结果进行类别归纳,从而实现了基于频次和关系的数据挖掘。
2 方剂库中证候要素的表述
朱氏等[3]对古今医家所提出的约120项“证候要素”概念进行辨析,筛选出50项具有共性特征的“证候要素”。其中,病位证候要素19项:心、神(脑)、肺、脾、肝、肾、胃、胆、小肠、大肠、膀胱、胞宫、胸膈、下焦(少腹)、表、半表半里、经络、肌肤、筋骨;病性证候要素31项:(外)风、寒、暑、湿、(外)燥、火(热)、痰、饮、水停、虫积、食积、脓、气滞、气闭、血瘀、血热、血寒、气虚、气陷、气不固、气脱、血虚、阴虚、亡阴、阳虚、亡阳、精(髓)亏、津(液)伤、阳浮、阳亢、动(内)风。
历史方剂文献中对“证候要素”的表达有些与此不同的情况。其中“病位”囊括了上述的19项内容,但还有其他内容的记载,如“冲脉”、“任脉”、“三焦”、“膜原”、“心下”、“目”等;“病性”在历史方剂文献中是以“病因”和“病机”的形式存在。
3 病位、病因、病机关系的挖掘
实验设计
由于方剂库中的“病位”与上述认识基本一致,为了和其他研究的方法有更好的沟通和讨论的基础,该实验设计以上述19个“病位”为研究对象