Literature
首页合作平台医学论文中西医结合论文中医中药

崔蒙,尹爱宁,范为宇,李园白:中医药科学数据建设研究进展

来源:〈中国中医药信息杂志〉
摘要:(中国中医科学院中医药信息研究所,北京100700)中医药学经过数千年的发展,已经积累了大量的数据,这些数据的利用、开发、共享对中医药学的发展具有重大意义。但目前这些数据的利用程度还远远不能满足需求,特别是近年来开展了大量的中医药科学研究,产生了大量的研究数据,这些数据的汇交、加工、管理和共享对中医药学创......

点击显示 收起

(中国中医科学院中医药信息研究所,北京100700)
    中医药学经过数千年的发展,已经积累了大量的数据,这些数据的利用、开发、共享对中医药学的发展具有重大意义。但目前这些数据的利用程度还远远不能满足需求,特别是近年来开展了大量的中医药科学研究,产生了大量的研究数据,这些数据的汇交、加工、管理和共享对中医药学创新发展具有重要的意义。在国家科技部和国家中医药管理局的支持下,中国中医科学院牵头组建了中医药科学数据虚拟研究中心。此中心旨在联合行业内的有关力量,在多学科参与下,有计划、全面地收集、整理、加工和利用现代中医药信息,并全面抢救、收集、整理、加工和利用数千年来积累下来的、浩如烟海的古代中医药学文献信息,加快中医药信息转化成为知识的速度,促进中医药知识的不断更新。
    中医药科学数据的建设是一项长期工程,是中医药科研的基础性工作,也是中医药科研的支撑条件建设,但又涉及了大量的研究性工作,有些研究甚至是当今科学研究的前沿问题。中医药科学数据的建设直接关系到中医药科学研究的发展,关系到中医药现代化的进程,因而具有重要的现实意义。此项研究二直得到科技部多个课题支持.
    中医药科学数据建设的目的是整合现有数据,使其最终覆盖中医药学科的各个领域,从而满足各种科研人员对数据的要求;建立相应的数据标准,规范建库行为,从而推进全国联合建库,进而为实现共建共享奠定基础;通过持续不断的数据建设,凝聚、培养、提高中医药行业的数据建设力量,形成一支专业研究队伍,优化全行业数据建设的基础条件和设备,全面推进科学数据建设的进程;通过科学数据的建设,为中医药科研提供支撑条件,提高中医药临床及科研水平,促进中医药学发展,保持中医药在世界传统医学界的领先地位。目前开展的工作主要包括以下几个方面。
1  数据库整合
    中医药科学数据的建设主要是从实际需求出发产生的,从目前的发展看,中药现代化的进程比中医现代化发展得快,因此中药数据库的建设速度比中医数据库的建设速度快,已建成的8个大型结构型数据库中有7个是中药数据库,且基本上覆盖了中药研究的各个领域。这种大型数据库的建设很难依靠某一个单位的力量实现,必须整合全行业的数据建设力量才能实现。此外,中医药科学数据建设需要整合不同研究所产生的数据,只有充分利用不同研究产生的数据,才能真正实现科学数据的共享。
1.1  中药基础数据库
    整合后的中药基础数据库包含中药单味药8142种,中药品种6328种。此数据库对所含中药建立了严格的数据筛选原则与标准,主要收录了相对严谨的中药基础数据,如药典或教科书中的数据。经过拆分后,能够实现简单的归类分析,如从功效、疾病、性味、归经、化学成分等方面对中药数据进行归类;同时还可以进行简单的关联分析,如单味药与性味、归经、疾病、功效等,功效与炮制品,炮制品与药理作用,药理作用与化学成分等。
1.2  中药实验药理数据库
    整合后的中药实验药理数据库收集了1990—2004年间开展的约20000余项中药药理实验研究结果,对中药新药开发具有一定的支撑作用,适用于从事中药新药研究的高层次人员。该数据库可对数据进行分类统计,包括单味药、化学成分、方剂、疾病、证候、证状等,并可进行组合统计,同时提供了数据来源的全文文献,以方便科研工作者使用。
1.3  中药化学实验浏览数据库
    整合后的中药化学实验浏览数据库,采集1990—2003年所进行的15 000余项实验研究结果,包括分离、提取、纯化、合成、鉴定、测定,可提供关联检索,包括实验对象、实验室、实验方法等,同样可提供原文查询。
1.4  中药化学实验统计数据库
    整合后的中药化学实验统计数据库将收录内容进行编辑和结构化分析之后,对中医药文献资料中出现的术语以及术语组合进行频次统计,为科研工作者提供此类检索查询服务,包括实验室统计、实验对象统计、实验方法统计、实验结果统计、交叉组合统计等.
1.5  “有毒’中药数据平台
    整合后的“有毒”中药数据平台全面收集、整理2005版  《中国药典》中明确标明“有毒”中药的相关数据,可将72  味“有毒”中药的相关中药信息、方剂信息、新药信息、化学成分信息、不良反应信息、古代文献信息等进行关联检索,提供与“有毒”中药相关的数据资料.该数据库可以使研究者充分了解中药不良反应与毒性相关的数据,提高对“有毒”中药的认识。
  1.6  方剂现代应用数据库
    整合后的方剂现代应用数据库主要介绍古今方剂现代应用和现代研究的结果,对每一方剂分别介绍方剂名称、药物组成、功效、主治、化学成分、临床应用等内容。
  1.7  中药古籍数据库
    整合后的中药古籍数据库对本草古籍进行收集整理,以知识元为核心,在知识表示体系的基础上,对古代本草文献进行加工、整理。通过该数据库,可以进行中药古籍的简单检索和语义检索,促进了古代文献的利用。
1.8  公共卫生突发事件救治方案辅助决策技术平台
    通过数据整合,该平台可对某一疾病进行证候、症状、中药、方剂等数据进行归类、统计分析,并提供原文查阅。
2数据标准研制
    中医药科学数据标准的研制主要是基于中医药学本体进行的,目的是支撑基于共建平台实现的全国范围内的统一数据库建设,避免因标准问题所导致的数据混乱;此外,数据标准建设的进展也将支撑中医药数据检索从计算机语言向自然语言的转变:对数据加工标准表的研制,还提供了一种边建库边建标准的范例,支撑了数据库的实际建设。目前已研制的标准主要包括以下6种。
2.1  中医药元数据标准
    中医药科学数据元数据标准在收录科技部《科学数据共享元数据》核心元数据和《医药卫生科学数据共享元数据标准》必选数据的基础上,根据其自身特点,在内容信息、数据表现信息等元数据子集中建立了相应元数据标准,形成了中医药元数据标准。
2.2  数据资源分类标准
    为了完成数据建设的顶层设计,制定了数据资源分类标准,编写了《中医药学数据资源手册》(第l稿),共8万余字,包括5个l级类目、39个2级类目、124个3级类目和325个数据库,基本涵盖了所有中医药数据资源。
2.3数据加工标准表
    数据加工标准表是在数据库的数据加工过程中动态形成,主要收录了数据库加工过程中实际遇到的必须使用的标准词汇,这是共同建库的基础,经由多中心所有专家共同协商制定的。包括29个数据加工标准表:治则与功效名称标准表、中医证候名称标准表、中医穴位名称标准表、中医经络标准表、中医针刺手法标准表、中医针灸方法标准表、给药方式标准表、给药途径标准表、中药归经标准表、功能检查标准表、年龄标准表、中药性味标准表、药物剂型标准表、研究方法标准表、肺功能标准表、诊断仪器标准表、内源性物质标准表、中药科属名称标准表、中成药名称标准表、中药化学含量测定标准表、中药化学通用检查方法标准表、制药工艺标准表、中药炮制辅料标准表、细菌病毒原虫标准表、炮制来源标准表、中药炮制作用分类标准表、疾病名称标准表、中药单味药名称标准表、药物名称标准表。
2.4  中国中医药学主题词表
    《中国中医药学主题词表》在促进中医药学词语标准化和中医药学数据库建设的标准化上一直发挥着巨大的作用,1987年、1996年分别发行了第1版和第2版。目前正在准备发行的2006年版《中国中医药学主题词表》(第3版).所含主题词按中医学科范畴分为15个大类、72个亚类,共收录主题词13364条,其中正式主题词8878条,入口词约4286条,对2版词表进行了删改,共计改变了155个主题词.新词表具有编制技术先进、词表体系结构科学、词语标准规范、收词完备、一表多用、实用性强、与国际权威医学词表Mesh兼容等特点。
2.5  中医临床标准术语集
    中医临床标准术语集是中医医院信息化建设和中医疗效评价标准建设的基础,可以促进中医国际交流合作和中医数据的共享。这项研究的结果将建立一部具有中医特色、与世界水平同步,并能与西医兼容的、具有权威性的、易于被计算机处理和被临床医生广泛接受的中医临床标准术语集。该术语集预期在2年内完成中医临床标准术语集框架体系的构建、术语的收录整理、完成术语间的语义关联并实现概念、关系的编码化处理、初步拟纳入10万个常用中医临床术语、完成在一定医疗及相关部门范围内的试用及修订。
2.6  中国中医药学语言系统
    中医药学语言系统是我国政府资助的,由全国十余家单位共同研制开发的术语集成、自然语言处理工具,是实现跨数据库检索的词汇转换的平台系统。中医药学语言系统是一个依据中医药学本体而建立的计算机化可持续发展的中医药学检索语言集成系统。目前,该系统包含127种语义类型,58种语义关系;收录术语324 417个,其中概念词167 588个、同义词156 829个,已完成130703个概念词的定义,建立起1275205项语义关系;使用参考书918种。    
3  共享平台    
    从1999年起,就已经建设了中医药多库融合关联检索平台,将多个不同类型、不同结构、不同软件支持的本地及异地数据库置于一个统一的检索平台上,为用户提供不同类型数据库在同一平台上的检索服务。
4  队伍建设
    ①集中全国中医药数据库建设力量,组织了全国30余家省级中医药院校和研究院的300余位中医药专业人员共同建库。②在进行中医药科学数据库建设的同时,在全国范围内锻炼培养了一支高素质的专业研究队伍,同时使得参与数据建设的单位更新了一批设备,从整体上提高了中医药行业数据建设的水平。⑧依托国际互联网形成了中医药科学数据库建设的虚拟专业网络,在制定统一的数据采集标准和规范建库行为的基础上,进行跨地、跨时空的数据加工,实现异地同步数据库建设。④在虚拟管理平台上,利用中医药科技数据库的技术规范、操作规程、远程管理模式及培训、奖励制度,实现了在线人员监控、数据安全管理、用户权限控制,以及数据三级审校管理制度,实现了无障碍远程科研协作。
5  结语
    目前中医药科学数据研究已经开展了大量的工作,取得了一定的成果。在今后的中医药科学数据研究中,要重视顶层设计,整合现有数据库资源,扩大数据覆盖面积,提高数据的利用程度,完善数据的相关标准,规范术语,加速数据库的共建共享,培养一支多学科、多院所的专业数据建设队伍,使中医药科学数据建设可持续发展,最终使中医药科学数据得到充分利用,推进中医药事业的发展。

作者: 崔蒙,尹爱宁,范为宇,李园白
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具