文档介绍:四川大学
博士学位论文
中医药数据挖掘系统TCMiner设计、实现与核心技术研究
姓名:李川
申请学位级别:博士
专业:计算机应用技术
指导教师:唐常杰
20060410
中医药数据挖掘系统杓啤⑹迪钟牒诵募术研究指导教师唐常杰教授掘系统诨虮泶锸奖喑痰氖萃诰蛞惶岢龌赟的支持计算机应用技术专业研究生李川中华医药有着多年的积淀和长期的医疗诊病历史,是中国文化的重要组成部分。然而,由于中药方剂为具体医疗经验的人工汇总,且为历史的继承,虽然有广博精深的中医理论作为支持,但传统中医理论为诊病方剂的人为总结和提炼,其整体性、辩证性、动态性等本质特征过于抽象和定性化,难于定量和具体的把握。数据挖掘旨在借助计算机强大的存储和计算能力,通过对分析需求的确切定义和高效的算法设计实现大规模数据库中有效的知识发现,为中医处方的研究提供了新的途径。四川大学计算机学院和成都中医药大学自年起合作进行了曛幸揭┦萃诰虻难芯坎⒑献骺7⒘酥幸揭┦萃本文的主要贡献包括:原型设计。设计中医药数据挖掘原型系统⑹迪制涞姹綯。首先,介绍中药数据分析方法学与技术路线,其次,分析中医药方剂多维数据分析的核心需求,再次,讲述低持懈方面的设计问题,然后,勾勒最终枋迪值南低彻δ芎陀Φ辈扇的体系结构,最后,描述高效算法的实现。核心技术研究。提出的核心技术:诨虮达式编程的数据挖掘,诠亓9嬖虻呐湮榉治觯诙辔捣模式挖掘的主成分分析。一次创建多次使用,解决了动态生成释放带来的时间开销,基于。
诠亓9嬖虻呐湮榉治觥L岢鏊饕捣蹦J绞鱶即突陔蝦高效算法快鍪考叮占湎慕谑个数量级,㈣加旧算法较证明的空间复杂度是勺胛鹊氖葡法重复遍历和重复计算的问题,大大提高了泶锖推拦赖男阅堋J验表明:,评估速度的基因评估算法只需一次遍历纯赏瓿苫虻钠拦溃饩隽舜撤平均提高倍。关联规则挖掘算法最近邻优先J笛楸砻鳎惴ǖ乃俣冉算法速度提高叮惴ń螦算法速度提高倍,且具有更好的可伸缩性。在中能有效地进行药物配伍分析。诙辔捣蹦J酵诰虻闹鞒煞址治觯禾岢龈咝诰蚨辔捣蹦J降乃惴诰蚨辔捣蹦J蕉簧墒萘⒎健V饕9毕兹缦拢正式提出多维频繁模式的概念和基于扩充灾实募糁Σ呗裕提出多维索引树和基于的多维频繁模式挖掘算法,互独立,笛楸砻鳎孀攀菸群褪菔频脑龀ぃ琈的速度较基于数据立方的算法快鍪考叮诙嗍榭鱿拢琈空间增长较基于数据立方的方法节省鍪考叮琌在中能有效地进行主药发现。关键词:中医药、数据挖掘、配伍分析、主成分分析、对应分析、频繁模式、多维频繁模式、关联规则、多维关联规则Ⅱ
,℃岣,,....
讼埃琲㈣珸,嫡,,:—產:秈,,,,琈..:‘萄轓—猟..:琒ⅱ,。:瓻:.∈.:
研究背景第滦髀中医药数据挖掘是近年来在中医药理论研究界和数据挖掘研究界逐步兴起的研究热点之一,是数据挖掘在中医药数据分析领域的应用,是一个有着光明前途和远大希望的前沿交叉学科。本节简要介绍中医药数据挖掘产生的背景。.谢R揭┘蚪中华医药,源远流长,博大精深,是国粹,是中华民族的文化瑰宝。在多年的发展历程中,中医药逐步形成了相对完整的理论体系和完全不同于西医西药的独特诊疗方法。在几千年的历史长河中,中医药为中华民族抵御疾病、维护健康,伴随着中华民族一代代的繁衍生息和发展壮大。中华医药资源丰富,记载在古中医书中的数十万计的历代验方是几千年来中医医疗诊病实践的真实记录。中医理论博大精深,相对西医单一的“还原论”而言,中医思想具有“整体性、动态性、辩证性”三个本质特征,即“天人合一”或“大而化之”的哲学思想‘”。近年来,随着中药现代化热潮的兴起,中药学的研究取得了长足的发展,就其工作方向而言,大致呈现如下两种研究路线:远ハ蛳碌拇持药学研究方法,强调中药的整体性;晕骰晌V鞯嫉淖缘紫蛏系南执原派研究方法,强调中药的动态性和辩证性。前者的研究主要集中在如下方面:低痴碇幸降浼酝加帽咎宸椒ǘ灾兄匦卤泶铩应用统计学、机器学习、人工智能、数据挖掘等技术对大量临床病例的中医证候进行规范化和标准化研究,努力制定中药在证、症、剂量、毒性等诸多方面的数字化标准并最终实现这些概念的量化。餍胁⊙А⒀ひ窖Х椒ā方剂结构研究。自顶向下研究的共同特点是:研究仍在中医理论框架之内,以“整体论”为指导,并不打破传统中药理论的黑箱结构,对药方及人体进行整体意义上的研究。“整体论”思维的主要观点是认为“总体不等于部分之和,总体不仅是个体数量上的加和,更是结构上的积累;系统的功能不等于组成系统的各部分功能的四川大学博士学位论文第
简单相加,研究系统的功能需从总体出发,以综合的观点看待系统的各部分”。后者的研究工作主要集中于如下方面:允笛榉椒ㄖっ髦幸├砺鄣挠行和科学性,通过直接的实验验证或间接的理疗验证为原有中医理论赋予现代医药科学的内涵。灾ず虼嬖谑抵