Literature
首页药品天地专业药学中药大全中药指纹图谱

一种评价中药色谱指纹谱相似性的新方法:向量夹角法

来源:中国色谱网
摘要:一种评价中药色谱指纹谱相似性的新方法:向量夹角法王龙星*1,肖红斌1,梁鑫淼1,毕开顺2(1。沈阳药科大学药物分析研究室,辽宁沈阳110015)摘要:目的根据向量夹角法,利用计算机自动计算两个分析指纹图谱间的相似度。方法将色谱指纹图谱看作多维空间内的向量,利用向量夹角余弦的基本公式计算两个指纹图谱间的相似......

点击显示 收起

一种评价中药色谱指纹谱相似性的新方法:向量夹角法 王龙星*1, 肖红斌1, 梁鑫淼1, 毕开顺2 (1. 中国科学院大连化学物理研究所, 辽宁 大连116012 2.沈阳药科大学药物分析研究室, 辽宁 沈阳 110015) 摘要:目的 根据向量夹角法,利用计算机自动计算两个分析指纹图谱间的相似度。方法 将色谱指纹图谱看作多维空间内的向量,利用向量夹角余弦的基本公式计算两个指纹图谱间的相似度;用VB6.0编程自动完成色谱峰匹配并计算相似度。结果 采用11个不同产地及炮制方法的吴茱萸样品的液相色谱指纹图谱对计算方法及程序进行了检验,结果表明该程序能较好的定量评价指纹图谱间的相似性,并清楚地区别了汤洗7遍这种炮制方法对指纹图谱的影响。 结论 此法能较好地定量评价指纹图谱间的相似性,可应用于中药质量控制。 关键词:中药;吴茱萸;指纹图谱;向量夹角法;质量控制 中图分类号:R927.11; R927.5 文献标识码:A 文章编号:051-4870(2002) 指纹图谱是近年来中药质量控制的热点,对中药材及成药来说,用指纹谱进行质量控制、判别真伪是一种很有前途的方法。目前根据整体谱图进行质量控制的数据处理方法主要有模式识别与人工神经网络的方法[1-3],这两种方法都是采用计算机自动寻找大量样本谱图的统计规律,再根据所建立的规律对待测谱图进行归类,它们给出的答案是一种分类及定性的信息,不直接定量比较两张指纹图谱间的相似度。但在很多情况下我们需要利用这种相似度的计算提供定量的评价信息,为中药质量控制提供依据。目前主要采用峰重叠率来表征谱图的相似度[4,5],这个方法在计算时仅考虑出峰的数目而不考虑峰的强度。为了能够全面反映出峰数目与峰强对指纹谱间相似度的影响,本文在多维空间向量夹角[6]的基础上提出了计算色谱指纹图谱之间相似度的方法,为中药指纹图谱质量评价提供了一个新方法。 基本原理 N个数值组成的行(x1, x2, x3,… xn)称为N维向量简记为大写字母X,定义 为向量X的模。如果存在两个向量X及Y则 称为X与Y的内积,X,Y之间的向量夹角按照(1)式计算。如果 越接近1则说明两个向量越相似[6]。 (1) 每个色谱指纹图谱都可以看作一组对应保留时间下的峰高(或峰面积)的数值,可把这组数值看作多维空间中的向量,使两个指纹图谱间相似性的问题转化为多维空间的两个向量的相似性问题,利用(1)式能够计算 来定量表征指纹图谱间的相似性。下面举一个简单的例子进一步说明向量夹角余弦的具体计算过程。假设有两张色谱图,每张色谱图包含4个色谱峰,3个是共有峰,此外每张谱图各有1个特有峰。第一张谱图共有峰的峰高按顺序为40,70,25;第二张谱图共有峰的峰高按顺序为39,71,24;第1张谱图特有峰的峰高是5;第2张谱图特有峰的峰高是7。则第1张谱图的向量是(40,70,25,5,0);第2张谱图的向量是(39,71,24,0,7), 向量夹角余弦的计算如下: =0.995。 即两个假设谱图的相似度是0.995。实际的指纹图谱往往有几十、上百个色谱峰,手工比较判断共有峰与特有峰以及计算相似度是烦琐的,因此本文使用VB6.0编制了一个小程序,只要给出两个色谱图的积分报告就能自动进行峰匹配,判断共有峰及特有峰,并将对应的数值填入向量的对应位置,计算相似度。实际计算中药指纹图谱相似度主要有以下4个步骤: (1) 在统一的样品处理与分析测试条件下获得色谱指纹图谱;(2) 进行谱图积分获得保留时间、峰高等信息;(3)根据分析时的噪声水平,将信噪比<5的色谱峰除去不作考虑;(4)用计算机自动进行两个指纹图谱之间的峰匹配,并利用(1)式计算 。 材料与方法 药材样品:11种吴茱萸药材样品,产地与炮制方法分别是:广西上林汤洗7遍;湖南怀化;湖南新晃甘草炮制;广西灌阳县;四川广元;广西百色;广西文市镇;广西灌阳茶用;广西上林甘草炮制;广西凌云仰村;贵州遵义。所有样品均由沈阳药科大学毕开顺教授鉴定并提供。 仪器及分析条件:Waters Alliance 2690 液相色谱系统;996二极管阵列紫外检测器(美国Waters 公司 ),Intersil ODS-3柱(4.6mm×250mm),检测波长为280nm。进样量2μL。流动相A为甲醇,流动相B为含0.3%醋酸氨的水溶液。二元梯度分离,流速1.0mL·min-1,梯度条件:0-5min A:5%,5-50min A:5%-100%,50-60min A:100%。 样品处理:称取吴茱萸果实4.00g加入40%乙醇水溶液100mL,回流2h,冷却后放入冰箱冷冻4h,过滤定容至100mL。取10mL过0.45μm滤膜待液相色谱分析。 结果与讨论: 1相同操作条件下不同样品色谱指纹谱的自动峰识别及匹配 虽然采用的数据处理模式各有不同,但在已有的有关色谱指纹谱质量控制的工作中,基本采用人工进行色谱指纹谱的峰识别及匹配后将峰高(或峰面积)数值输入电脑进行数据处理。这种做法不适于把指纹谱质量控制真正运用于实际。人工比对、手工输入既烦琐又容易出错,本文提出了一套方法及原则,并编程实现了对11种吴茱萸样品液相色谱指纹图谱(见图1)的自动峰匹配。 随着分析仪器技术的进步,分析仪器上保留时间的重复性越来越好,只要严格控制色谱条件就能够保证色谱峰的出峰次序不变并且保留时间差异较小, Figure 1: HPLC of eleven kind of Fructus evodia (Detailed sample information are listed in Table 2) 对液相色谱即使在梯度分离的条件下保留时间差别小于1min是容易做到的,对气相色谱而言保留时间的差异甚至小于2s,在这种情况下用计算机进行色谱峰的匹配也是能够做到的。以液相色谱的峰匹配为例,液相色谱的峰宽最小在0.3min左右,如果仅考虑保留时间差别小于1min这个条件则对第一张谱图的每个色谱峰在第二张色谱图上能找到0到3个峰与之对应(1min内最多出3个峰),也就是说每个色谱峰的峰匹配可能性有0-3个,把全体色谱峰的匹配可能性排列组合就可列出所有可能的谱图匹配结果,当然有的匹配结果违反色谱峰流出次序不变的原则应被排除,在剩下的其它匹配结果中,挑选相似度最大的匹配结果作为答案输出。由于对应的色谱峰峰高越接近则相似度的计算结果越好,挑选峰高最接近的匹配结果就可以保证相似度的计算结果最大,这样可以减小运算量加快程序的运行速度。本文提出的程序是在下列三条原则的基础上进行峰匹配(流程图见图2):(1) 同一分析条件下两张指纹谱对应色谱峰的保留时间差异在合理的范围以内。(视具体情况而定,本文吴茱萸指纹谱的例子中保留时间差异小于1min);(2) 同一分析条件下两张指纹谱的出峰次序不变。(3) 在满足(1)、(2)的同时寻找使相似度最大(峰高最接近)的峰匹配结果。以灌阳与广元样品为例详细说明在保留时间漂移的情况下本程序是如何进行峰匹配、并给出正确的匹配结果。表1列出了它们的保留时间与峰高(为节省篇幅,表1仅列出了45个色谱峰中的前28个,但这不妨碍对自动峰匹配的理解)。对3.078这个色谱峰,如果认为保留时间绝对误差小于1min,则第二张色谱图上有3个峰可与之对应:2.962,3.475,3.617,再考虑最相似原则,则2.962应与其匹配(峰高最接近);再看3.597这个色谱峰,2.962,3.475,3.617与它的保留时间差别小于1分,但2.962已经被匹配,在剩下的两个色谱峰中3.475的峰高与3.597的峰高最相近,所以这两个色谱峰应被匹配到一起,在此之后可以判断对第二张谱图的3.617峰在合理的保留时间误差范围内在第一张谱图上没有色谱峰与之匹配(3.078,3.597已经被匹配不能重复考虑)是特有峰。5.508只能与5.301相对应,而6.478这个色谱峰在合理的保留时间范围内在第二张谱图上找不到与其对应的色谱峰是第一张谱图的特有峰。再看另一个较特殊的情况:对第一张谱图上27.368与27.876这一组色谱峰如果仅考虑保留时间差别在1分以内与峰高最相近原则似乎应当给出这样的匹配结果27.368-27.719; 27.876-27.189,但这个结果并不合理,因为这样的结果等于承认第一张谱图先出的色谱峰在第二张色谱图上后出峰;且第一张谱图后流出的色谱峰在第二张色谱图上先出峰,这违反了前面提到的出峰次序不变原则,所以最终的匹配结果应当倒过来是27.368-27.189;27.876-27.719。本文提出的程序就是按照上面类似的步骤,对表1的几十个色谱峰逐一进行峰匹配,判断是否为特有峰,并将对应的峰高数值添入向量的对应位置,按照(1)式计算向量夹角余弦。对气相色谱而言,只是保留时间的重复性更好,自动峰匹配的做法是相似的,本文提出的程序也同样适用于气相色谱指纹谱的自动峰匹配。 2 11种吴茱萸样品的相似度计算结果 本文所举吴茱萸的例子并非立即建立实用的吴茱萸质控方法,只是用来表明我们的方法能够较好的自动计算指纹谱间的相似度,这种相似度也较好地反应了谱图间的整体差异性。贵州遵义产吴茱萸是一道地品种,我们选它为基准比较、计算了其它样品和它的相似度结果如表2。从结果看所有吴茱萸样品除汤洗7遍吴茱萸外都比较相似,相似度都在78%以上,而汤洗7遍吴茱萸的相似性只有42.3%,这说明该方法能够很好的区分汤洗7遍这种炮制方法。从图1的直观比较可看出,自上而下谱图与贵州遵义样品越来越相似,而相似度计算结果正好越来越高,从第一张上林汤洗7遍样品的42.3%上升到第十张广西凌云样品的92.1%,本程序的计算结果与直观比较是一致的,这说明该计算方法是合理的。第11张谱图就是贵州遵义样品,它和自身相比较相似度是100%,这也是合理的,如果一个色谱图对自身的相似度不是100%则说明程序计算有误,因 Table 1: Retention time and peak height of Guanyang sample and Guangyuan sample Guan yang Sample Guang yuan Retention Time (min) Peak Height (μV) Retention Time (min) Peak Height (μV) 3.078 7310 2.962 5263 3.597 2528 3.475 3118 5.508 2319 3.617 1655 6.478 2393 5.301 5694 11.594 17442 10.926 11337 12.162 3746 11.588 3723 12.399 3320 13.39 9940 13.827 15974 13.669 3062 14.104 5558 13.96 2446 14.646 2109 14.254 2275 15.13 31927 14.779 23232 15.596 6845 15.257 5862 15.867 13567 15.55 6438 16.101 7323 15.794 3014 16.412 6754 16.096 4312 16.781 1826 17.838 14192 17.817 2152 18.708 17296 18.117 22212 19.314 2085 18.976 10701 19.51 6404 19.543 3286 21.35 8444 19.733 11390 22.541 8975 21.595 5062 25.862 3934 22.774 10500 27.189 2611 23.597 1682 27.719 4580 27.368 4313 28.513 2078 27.876 3056 29.253 19465 28.673 4787 30.038 5248 29.417 22758 31.004 1905 Table 2: Results of similarity of Chromatograms No. Origin S 1 Shanglin,GuangXi,washed with hot water 42.30% 2 Huaihua,HuNan 78.60% 3 Xinhuang,HuNan,processed with licorice 84.90% 4 Guanyang,GuangXi 85.20% 5 Guangyuan, SiChuan 85.20% 6 Baise,GuangXi 85.80% 7 Wenshizhen, GuangXi 87.50% 8 Guanyang, GuangXi 87.90% 9 Shanglin,GuangXi,processed with licorice 89.70% 10 Yangcun,Lingyun,GuangXi 92.10% 11 Zunyi,GuiZhou 100% S is the similarity between the chromatogram of this sample and the chromatogram of Zun yi sample 1,4,5,6,7,8,9 Evodia rutaecarpa (Juss.) Benth 2,3,10,11 E.rutaecarpa(Juss.)Benth.var.officinalis(Dode)Huang 此这个100% 的相似度是对程序正确性的另外一种验证。众所周知,人工比较谱图进行峰匹配的做法主要是依据保留时间,在保留时间有漂移的情况下用计算机寻找相似度最大的峰匹配结果会比人工比较更可靠。此外人工比较时通常只比较大一点的色谱峰而忽略小峰,而计算机比较则可以把小色谱峰也考虑在内,这样的计算结果能反应谱图的细微差别。四川广元样品与广西灌阳样品的谱图在直观上看来是比较相似的,如果仅考虑信噪比>30的色谱峰则它们的相似度计算结果为95%,而如果考虑所有信噪比>5的色谱峰则相似度计算结果是89%,从这个结果看考虑小峰的差别能更精细的反应谱图的不同。一般来说不同品种的药材其指纹图谱差异较大而相同品种的药材指纹图谱差异较小因此本方法也有可能用作区分不同品种及产地的药材。如果利用多种道地药材的标准提取物建立了标准谱图,那么通过待测样品与标准谱图的相似度比较有可能判断样品究竟是哪一种药材,这也是今后进一步研究的目标。 3 向量夹角余弦法与其它数据处理方法的比较 向量夹角余弦法数学概念简单、数据处理过程简便快速,在定量计算两张色谱指纹谱相似度方面有其优势,但在数据分类、特征变量的提取等其它方面,还是传统的模式识别及人工神经网络方法更有效,将来的质量控制也许应当将两者结合起来,发挥各自的优势,共同解决指纹谱质量控制的难题。 REFERENCES [1] Qiao Y.J, Wu G, Wang X, et al. Quality assessment of venenum bufonis by neural network pattern recognition [J]. Chin J Anal Chem 1995,23(6): 630-635 [2] Zhang L ,Liu Z.P, Yang Ch. Qualitative recognition on omitted ingredients in Liuwei Dihuang Pills by bayesian analysis and PRIMA [J]. China J Chin Mater Med 2000,25(1):29-33 [3] Su W.W, Study of chemical pattern recognition of herba Asari [J]. J Chin Med Mater 1999, 22(6): 279-283 [4] Zhang S, Wang Z.H, Jin D.Z. Comparative study on HPLC-FPS of Chinese red ginseng and Korean ginseng [J]. Chin Tradit Pat Med, 2001, 23(3):160-165 [5] Hong Y.K, Wang Z.H, Li X. Distinguish Radix at rhizoma rhei by relative retention value of HPLC [J]. J China Mater Med 1993,18(11):650-652 [6] Alexander L (Wang Y, Wan Z.X translation),《Contents, Methods and Meaning of Mathematics》[M]. Vol 3. Beijing: Science Press, 1962:48-57 VECTORIAL ANGLE METHOD FOR EVALUATING THE SIMILARITY BETWEEN TWO CHROMATOGRAPHIC FINGERPRINTS OF CHINESE HERB WANG Long-xing 1, XIAO Hong-bin1 , LIANG Xin-miao1 , BI Kai-shun2 (1 Dalian Institute of Chemical Physics, Chinese Academy of Sciences, Dalian 116012, China 2 Shenyang Pharmaceutical University, Shenyang 110015, China) ABSTRACT: AIM To Calculate the similarity between two chromatographic fingerprints automatically with computer. METHOD Chromatogram could be treated as vector of hyperspace, and the similarity between them can be counted according to vectorial angle formula. This process was performed with software written in Visual Basic 6.0. The two main functions of this software are automatic peak tracking in two fingerprints under the same analytic condition and computing the similarity automatically. RESULTS The HPLC fingerprints of eleven kinds of Fructus evodiae (a traditional Chinese herb) from different sources were obtained and the similarities were calculated with this software. This method was proved to be a good way to evaluate the similarity between two fingerprints. A sample washed seven times with hot water could be clearly discriminated from other samples of Fructus Evodia by the similarity results. CONCLUSION This method is a good way to evaluate the similarity between two fingerprints and is helpful in quality control of traditional Chinese medicine. KEY WORDS: traditional Chinese medicine; Fructus evodiae; fingerprint; vectorial angle method, quality control
作者: 王龙星*1, 肖红斌1, 梁鑫淼1, 毕开顺2 2007-5-18
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具