Literature
首页药品天地专业药学中药大全中药指纹图谱

一种评价中药色谱指纹谱相似性的新方法

来源:www.zgycsc.com
摘要:摘要:目的根据向量夹角法,利用计算机自动计算两个分析指纹图谱间的相似度。方法将色谱指纹图谱看作多维空间内的向量,利用向量夹角余弦的基本公式计算两个指纹图谱间的相似度。0编程自动完成色谱峰匹配并计算相似度。结果采用11个不同产地及炮制方法的吴茱萸样品的液相色谱指纹图谱对计算方法及程序进行了检验,结果表......

点击显示 收起

  摘要:目的 根据向量夹角法,利用计算机自动计算两个分析指纹图谱间的相似度。方法 将色谱指纹图谱看作多维空间内的向量,利用向量夹角余弦的基本公式计算两个指纹图谱间的相似度;用VB6.0编程自动完成色谱峰匹配并计算相似度。结果 采用11个不同产地及炮制方法的吴茱萸样品的液相色谱指纹图谱对计算方法及程序进行了检验,结果表明该程序能较好的定量评价指纹图谱间的相似性,并清楚地区别了汤洗7遍这种炮制方法对指纹图谱的影响。 结论 此法能较好地定量评价指纹图谱间的相似性,可应用于中药质量控制。

  关键词:中药;吴茱萸;指纹图谱;向量夹角法;质量控制

  指纹图谱是近年来中药质量控制的热点,对中药材及成药来说,用指纹谱进行质量控制、判别真伪是一种很有前途的方法。目前根据整体谱图进行质量控制的数据处理方法主要有模式识别与人工神经网络的方法[1-3],这两种方法都是采用计算机自动寻找大量样本谱图的统计规律,再根据所建立的规律对待测谱图进行归类,它们给出的答案是一种分类及定性的信息,不直接定量比较两张指纹图谱间的相似度。但在很多情况下我们需要利用这种相似度的计算提供定量的评价信息,为中药质量控制提供依据。目前主要采用峰重叠率来表征谱图的相似度[4,5],这个方法在计算时仅考虑出峰的数目而不考虑峰的强度。为了能够全面反映出峰数目与峰强对指纹谱间相似度的影响,本文在多维空间向量夹角[6]的基础上提出了计算色谱指纹图谱之间相似度的方法,为中药指纹图谱质量评价提供了一个新方法。 
  基本原理 N个数值组成的行(x1, x2, x3,… xn)称为N维向量简记为大写字母X,定义 为向量X的模。如果存在两个向量X及Y则 称为X与Y的内积,X,Y之间的向量夹角按照(1)式计算。如果 越接近1则说明两个向量越相似[6]。 (1) 每个色谱指纹图谱都可以看作一组对应保留时间下的峰高(或峰面积)的数值,可把这组数值看作多维空间中的向量,使两个指纹图谱间相似性的问题转化为多维空间的两个向量的相似性问题,利用(1)式能够计算 来定量表征指纹图谱间的相似性。下面举一个简单的例子进一步说明向量夹角余弦的具体计算过程。假设有两张色谱图,每张色谱图包含4个色谱峰,3个是共有峰,此外每张谱图各有1个特有峰。第一张谱图共有峰的峰高按顺序为40,70,25;第二张谱图共有峰的峰高按顺序为39,71,24;第1张谱图特有峰的峰高是5;第2张谱图特有峰的峰高是7。则第1张谱图的向量是(40,70,25,5,0);第2张谱图的向量是(39,71,24,0,7), 向量夹角余弦的计算如下: =0.995。即两个假设谱图的相似度是0.995。

  实际的指纹图谱往往有几十、上百个色谱峰,手工比较判断共有峰与特有峰以及计算相似度是烦琐的,因此本文使用VB6.0编制了一个小程序,只要给出两个色谱图的积分报告就能自动进行峰匹配,判断共有峰及特有峰,并将对应的数值填入向量的对应位置,计算相似度。实际计算中药指纹图谱相似度主要有以下4个步骤: (1) 在统一的样品处理与分析测试条件下获得色谱指纹图谱;(2) 进行谱图积分获得保留时间、峰高等信息;(3)根据分析时的噪声水平,将信噪比<5的色谱峰除去不作考虑;(4)用计算机自动进行两个指纹图谱之间的峰匹配,并利用(1)式计算 。 

  材料与方法 药材样品:11种吴茱萸药材样品,产地与炮制方法分别是:广西上林汤洗7遍;湖南怀化;湖南新晃甘草炮制;广西灌阳县;四川广元;广西百色;广西文市镇;广西灌阳茶用;广西上林甘草炮制;广西凌云仰村;贵州遵义。所有样品均由沈阳药科大学毕开顺教授鉴定并提供。 
仪器及分析条件:Waters Alliance 2690 液相色谱系统;996二极管阵列紫外检测器(美国Waters 公司 ),Intersil ODS-3柱(4.6mm×250mm),检测波长为280nm。进样量2μL。流动相A为甲醇,流动相B为含0.3%醋酸氨的水溶液。二元梯度分离,流速1.0mL·min-1,梯度条件:0-5min A:5%,5-50min A:5%-100%,50-60min A:100%。样品处理:称取吴茱萸果实4.00g加入40%乙醇水溶液100mL,回流2h,冷却后放入冰箱冷冻4h,过滤定容至100mL。取10mL过0.45μm滤膜待液相色谱分析。
  结果与讨论: 
  1相同操作条件下不同样品色谱指纹谱的自动峰识别及匹配虽然采用的数据处理模式各有不同,但在已有的有关色谱指纹谱质量控制的工作中,基本采用人工进行色谱指纹谱的峰识别及匹配后将峰高(或峰面积)数值输入电脑进行数据处理。这种做法不适于把指纹谱质量控制真正运用于实际。人工比对、手工输入既烦琐又容易出错,本文提出了一套方法及原则,并编程实现了对11种吴茱萸样品液相色谱指纹图谱(见图1)的自动峰匹配。 随着分析仪器技术的进步,分析仪器上保留时间的重复性越来越好,只要严格控制色谱条件就能够保证色谱峰的出峰次序不变并且保留时间差异较小, 对液相色谱即使在梯度分离的条件下保留时间差别小于1min是容易做到的,对气相色谱而言保留时间的差异甚至小于2s,在这种情况下用计算机进行色谱峰的匹配也是能够做到的。以液相色谱的峰匹配为例,液相色谱的峰宽最小在0.3min左右,如果仅考虑保留时间差别小于1min这个条件则对第一张谱图的每个色谱峰在第二张色谱图上能找到0到3个峰与之对应(1min内最多出3个峰),也就是说每个色谱峰的峰匹配可能性有0-3个,把全体色谱峰的匹配可能性排列组合就可列出所有可能的谱图匹配结果,当然有的匹配结果违反色谱峰流出次序不变的原则应被排除,在剩下的其它匹配结果中,挑选相似度最大的匹配结果作为答案输出。由于对应的色谱峰峰高越接近则相似度的计算结果越好,挑选峰高最接近的匹配结果就可以保证相似度的计算结果最大,这样可以减小运算量加快程序的运行速度。
  本文提出的程序是在下列三条原则的基础上进行峰匹配(流程图见图2):
  (1) 同一分析条件下两张指纹谱对应色谱峰的保留时间差异在合理的范围以内。(视具体情况而定,本文吴茱萸指纹谱的例子中保留时间差异小于1min);
  (2) 同一分析条件下两张指纹谱的出峰次序不变。
  (3) 在满足(1) 、(2)的同时寻找使相似度最大(峰高最接近)的峰匹配结果。以灌阳与广元样品为例详细说明在保留时间漂移的情况下本程序是如何进行峰匹配、并给出正确的匹配结果。

  众所周知,人工比较谱图进行峰匹配的做法主要是依据保留时间,在保留时间有漂移的情况下用计算机寻找相似度最大的峰匹配结果会比人工比较更可靠。此外人工比较时通常只比较大一点的色谱峰而忽略小峰,而计算机比较则可以把小色谱峰也考虑在内,这样的计算结果能反应谱图的细微差别。四川广元样品与广西灌阳样品的谱图在直观上看来是比较相似的,如果仅考虑信噪比>30的色谱峰则它们的相似度计算结果为95%,而如果考虑所有信噪比>5的色谱峰则相似度计算结果是89%,从这个结果看考虑小峰的差别能更精细的反应谱图的不同。一般来说不同品种的药材其指纹图谱差异较大而相同品种的药材指纹图谱差异较小因此本方法也有可能用作区分不同品种及产地的药材。如果利用多种道地药材的标准提取物建立了标准谱图,那么通过待测样品与标准谱图的相似度比较有可能判断样品究竟是哪一种药材,这也是今后进一步研究的目标。 3 向量夹角余弦法与其它数据处理方法的比较 向量夹角余弦法数学概念简单、数据处理过程简便快速,在定量计算两张色谱指纹谱相似度方面有其优势,但在数据分类、特征变量的提取等其它方面,还是传统的模式识别及人工神经网络方法更有效,将来的质量控制也许应当将两者结合起来,发挥各自的优势,共同解决指纹谱质量控制的难题。
作者: 2008-5-27
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具