孙海舒,李宗友,王映辉,李鸿涛,李敬华,于 彤,李 兵,王 蕊,邱润苓,张一鸣(中国中医科学院中医药信息研究所,北京 100700)

【方药研究】

方剂数据库顶层设计原则初探❋

孙海舒,李宗友△,王映辉,李鸿涛,李敬华,于 彤,李 兵,王 蕊,邱润苓,张一鸣
(中国中医科学院中医药信息研究所,北京 100700)

方剂是中医治病与养生的主要形式与手段,是中医理论与临床联系的重要途径之一。方剂数据库利用电子手段组织、存储和检索的作品或资料集合。在中医理论指导下,利用电子手段组织方剂内容,有利于中医方剂的传播与利用,有利于提升中医药健康服务能力。通过分析现有方剂数据库的特点,试总结方剂数据库整体设计的三个关键因素,即方剂源流的纳入、方剂的分类、方剂原生信息的处理,对方剂数据库的文献纳入、检索与利用功能的合理布局以及知识产权保护作有益的探索。

方剂;方剂数据库;设计原则

“中医药兼具人文与医学科学的多重属性,是我国独具特色的卫生资源、经济资源、科技资源、文化资源和生态资源,是中华文明与‘一带一路’沿线国家交流合作的最佳载体”[1]。时至今日,作为我国独具特色的医药卫生资源、拥有自主创新优势的科技研发资源、具有发展潜力的民族产业资源和服务贸易资源,以及其他领域难以替代、别国难以复制的文化传播载体,在保障人民健康、推动医学科学进步、促进经济社会发展、提升国家软实力中发挥着重要的作用。基于背景因素的考量,在中医理论指导下的方剂,是我国拥有自主知识产权优势的领域之一,从古籍中获取的方剂信息是建立方剂数据库的关键来源。如何安全有效地利用好方剂数据库这个载体,是设计方剂数据库要解决的基本问题之一。基于中国中医科学院自主课题,对方剂数据库的顶层设计做了有益的探索。

1 现有方剂数据库概况

通过文献考察与市场调研,依据运作模式,目前使用的方剂库大致可以分为三类,一是商业运作模式的数据库,如中国方剂数据库;二是公益性网络数据库,如“生物谷数据中心”的方剂数据库;三是由各级各类课题资助的专题数据库,如南京中医药大学研制的《中医方剂文献数据库》《湖湘中医单验方数据库》《古代肝病方剂数据库》等[2-4]。从内容角度来看,有以现代期刊中应用的方剂为主的“中医药数据库检索系统”[5];还有一部分则基于古籍原文建立的方剂数据库[6-7];以二次文献建立的数据库,如《中医大辞典·方剂分册》[8]等,是方剂数据库常见的类型。如果单纯考虑方剂纳入的数量,《太平圣惠方》收方16834首,《圣济总录》载方20000多首,《普济方》载方60000余首,一个数据库的方剂总量越大,值得研究、利用的空间也越大。处理重复出现的方剂,也须谨慎。

2 数据库的异同

2.1 数据库基本内容比较

表1显示,虽然资助来源不同,但是基于用户角度考虑使得不同的数据库在内容上有可比性。

表2显示,由课题资助的方剂数据库,相比方剂数量来看,主题比较重要。这一类数据库相对定位准确,描述详细,界面友好。以《湖湘中医单验方数据库》《古代肝病方剂数据库》比较为例。

2.2 数据库基本功能及使用状况

中国中医科学院方剂数据库,即中国方剂数据库,由中药方剂查询系统和子集方剂查询系统组成,2个查询系统可以满足不同的限定查询需求[9]。中医方剂文献数据库由南京中医大学方剂文献研究室主任孙世发研究员主持,依据其内容的基本数据,实现检索和归纳任一同类方剂,并可以通过索引进行方名、书名、药名、药味、功效等内容的快速英文单词检索,进行多项目综合检索和模糊检索,并具有动态管理功能。生物谷方剂数据库由生物谷数据中心开发,实现了在线自由获取功能。

但是方剂数据库也面临一些问题,如商业化数据库没有可持续的后续数据注入,距离临床有差距。网络可以自由获取的数据库,非医背景的读者获取之后不能正确使用;因为没有清晰的源流或校雠,医务人员无法采信。课题资助的专项数据库,利用度往往限制在小范围之内。如何规避上述问题,是建立数据库顶层设计需要注意的问题。

3 建立数据库的顶层设计

3.1 方剂源流纳入的规则

中医方剂是在辨证论治之后,选择合适的中药酌定用量,按照组成原则妥善配伍而成。中医方剂包含在中医药古籍中。依据《中国中医古籍总目》的分类,方剂即集中于方书之中,又散见于经典、养生、医案、临证各科,还有少量存在于针灸医籍之中。据文献记载,截止晚清历代古方近10万首,该数据尚未纳入民间的抄本、稿本等。根据上述方剂数据库的对比结果,方剂有效信息之一是方剂的来源,即方源信息。方源信息是数据库的源头,方书的来源、版本、馆藏地以及相关文献信息、方剂来源的简化,模糊了方剂的朝代个性,不同时期的症状、药名,代表的内涵并不完全相同,方剂纳入的源头清晰与否,直接影响数据库的准确性。所以,纳入古籍中的方剂必须清晰地录入古籍的版本信息,保留并体现朝代对方剂的影响;在方剂达到一定数量后,便于整理方剂的源流与衍变。

表1 数据库基础内容比较

表2 《古代肝病方剂数据库》

3.2 顶层设计关键因素之一——方剂的分类

方剂分类的完善与否,决定了方剂数据向知识库的转化。方剂分类一直是学界研究的重点之一,分类原则有病证、病因、功效、治法、组成等不同模式。各种分类标准均由其目的所决定,因而不同的目的就产生了各异的分类。《内经》的“七方”分类方法;唐·孙思邀的《千金要方》,先按人体脏腑列出大类,然后各脏腑类之下又按病证分为若干类;《千金翼方》则按照类方分类;徐之才《药对》的“十剂”;汪昂《医方集解》采用综合分类法,以类方形式为例分析其分类特点。但是类方的分类方式,也不能完全表达方剂的核心概念。

设计方剂数据库,分类是顶层设计中重要的一个环节。如果依据国际社会较易接受的以临床各科分类的思维方法进行编排,那么如何处理在中医理论指导下异病同治或者同病异治的方剂?如果依据教材现行的分类方式单独分类,如“治燥剂”不免有重复之嫌,功能分类只能满足主治“纯粹”的方剂,那些可以“多科治疗”的方剂如何处理?如果根据辞书的编排方式,以方名首字的笔划或者拼音排列,确实便于查找,对于没有方名的方剂如何处理?

简而言之,方剂分类的根据应该是方剂的本质属性,但方剂的属性往往有多个表现层面,这就需要一个相对统一、业内能够达成共识的提取原则。如果不能把握提取特性的原则,势必导致方剂分类的混乱,从而影响数据库的利用。能否探索一种有效的层级分类方式,既能考虑检索的便利,又能尽量保留方剂的特点,中国中医科学院中医药信息所在方剂数据库的设计中进行了有益的探索。在框架方面采用《古今图书集成医部全录》中的层级结构,适当引入“五运六气”,根据录入方剂的具体情况适当调整;对于没有方名的方剂组成,也引入“五运六气”,以功效或主治查询,并为方剂注明来源或版本,提供图片链接。

3.3 顶层设计关键因素之二——方剂原生信息的处理规则

方剂本身的信息又称为原生信息,诸如药物组成、配伍特点、主治病症、方名、药名、剂量、治法、功效等。原生信息需要有目的排列、细化、清除冗余数据,利于数据库的运行。但是考虑到朝代、地域、作者、经济政治等背景因素的影响,合并同类项式的数据整理,可能在某种程度上变成了“去中医化”;方剂的使用,一定是在中医理论指导下的化裁,摈弃了中医理论,只是简单的药味堆积;从数据库的角度而言,引入“方论”或者是基础理论的内容,不是技术的问题,而是顶层设计必须考虑的关键因素之一。

3.4 顶层设计关键因素之三——方剂数据库与知识产权

中医方剂或中医复方,是我国传统中医药知识产权保护的内容之一[10]。另一方面,中医药具有明显的特色优势,在中医理论指导下的方剂即是这种优势的体现。在提升中医药国际服务能力的趋势下,如何在继承中医、保护知识产权的基础上发挥方剂的优势?作为方剂数据库的顶层设计,知识产权保护是关键因素之一。

从知识产权的角度来看,欧共体法律将数据库定义为“由论文、数值、图形或其他情报的集合体并能利用计算机检索上述情报的系统构成的作品”。目前在国内,有文献资料支撑的方剂数据库,其研究重点在于方剂内容的本身和应用技术的层面,如纳入的数量、内容的覆盖范围、清晰或挖掘技术等。而在方剂的知识产权保护方面几乎是研究的盲点,探索知识产权保护视角下的数据库构建模式可以成为方剂数据库研究的重点。

虽然方剂的载体,中医古籍存在署名权,但是阅读古籍并不受限制,一些实用价值高的方剂遭遇了“资源掠夺”“名牌流失”及一些重要创新成果不能及时申请专利保护等性质的事件。如何既保证古代医籍中的方剂得以利用,又保护其不被恶意掠夺。基于中国中医科学院的自主课题,研究人员做了积极的探索。将古籍中的方剂以文本化形式抽取,按照一定的分类原则将古籍内容“碎片化”,并依据一定的排列、组合方式,形成符合某项功能的方剂数据库或者知识库。换言之,按照某种组合方式,将一系列自身拥有独立着作权的古籍作品重新组合,形成古籍着作的机读版本。

关于排列组合方式,以中国中医科学院信息所《古籍方剂知识库》为例,简要介绍如下。

用户需求决定数据库(知识库)的使用周期。首先保证文献来源的忠实性。在纳入古籍文本化数据之前,要对这部分数据进行校对,务必保证纳入的数据忠实原文,如果因为影响理解而修改,必须有合理的解释以及出处。如针对不同时代方剂的剂量,仍依原文录入,对于有据可循的换算,通过技术手段加以链接而不是修改原文。其次要根据临床需求,做好方剂数据的分类。根据“病机十九条”并结合五运六气进行一级类目的划分,保证“方对法立”的原则,每条病机之下再列第二级类目,“门”下依次为内、外、妇、儿科门。再通过技术手段预留分类空间,满足不断纳入数据的进一步分类。对于标准术语库与文献术语索引等关键技术,目前仍在研究当中。

4 总结与讨论

方剂的应用是中医治疗疾病的基本手段之一,是在中医理论指导下的治疗方法。据《全国中医图书馆联合目录》记载,仅清代以前的“方书类”医籍高达1216种。古代医籍中记载的方剂,记录了历代各位医家临证经验体会,是后人总结中医临证规律、借鉴利用前人临床审证、用药、处方经验的宝贵资料。如果能够将古籍中的方剂信息抽取出来,根据需求重新进行排列组合,并使用一定的技术手段,那么方剂数据库将是突破古籍保护与利用瓶颈的有效手段之一,既挖掘了前人的经验,又通过知识产权的形式对宝贵资源加以必要的保护;既能发挥中医药优势特色的传承,也是实现中医知识产权保护的主要措施之一。

[1] 向佳.全国政协委员、国家中医药管理局副局长于文明:“一带一路”合作中医药是最佳载体[N].人民政协报,2015-05-13(5).

[2] 张新玲.《中国中医药数据库检索系统》Windows版的检索策略探讨[J].陕西中医学院学报,2001,24(5):65-66.

[3] 谭玉美.湖湘中医单验方数据库的建构[D].长沙:湖南中医药大学,2013: 5-10.

[4] 张林.计算机辅助古代肝病方剂组方规律的研究及古代肝病方剂数据库初探[D]北京:北京中医药大学,2004: 10-38.

[5] 中国中医药数据库检索系统.[Online]Available:http://cowork.cintcm.com/engine/windex.jsp.

[6] 刘阳.数据仓库技术在《金匮》文献整理和研究中的应用初探[D].北京:北京中医药大学,2003.

[7] 陈波,蒋永光,胡波,等.东垣脾胃方配伍规律之关联分析评述[J].中医药学刊, 2004,22(4):611-612.

[8] 蒋永光,李力,李认书,等.中医脾胃方配伍规律的数据挖掘试验[J].世界科学技术,2003,5(3):33-37.

[9] 周志焕,年莉.方剂数据库及数据挖掘应用研究述要[J].山东中医杂志,2013,32(10):768-770.

[10] 李宗友,雷燕.中医知识产权保护的战略研究[J].中国中医药信息杂志,2005,12(11):1-3.

中国中医科学院基本科研业务费自主选题(ZZ080314);中国中医科学院基本科研业务费自主选题(ZZ090303)

孙海舒(1976-),女,山东青岛人,副研究员,主治医师,医学博士,从事中医古籍暨名老中医经验整理与利用研究。

△通讯作者:李宗友,男,研究员,硕士研究生导师,从事中医药信息与软科学研究,Tel:010-640895990,E-mail:lizongyou@sina.com。

R289.1

A

1006-3250(2017)04-0546-03

2016-10-17