Literature
Home药品天地专业药学实验技术色谱技术色谱论文

分析化学取样理论研究进展

来源:中国色谱网
摘要:摘要从化学计量学角度就分析化学的取样理论研究进行了系统总结。主要包括:取样误差与研究总体的理化性质间的关系。现代数理统计的理论和方法在分析取样中的应用。分析取样的质量控制。...

点击显示 收起

摘 要 从化学计量学角度就分析化学的取样理论研究进行了系统总结。主要包括:取样误差与研究总体的理化性质间的关系;现代数理统计的理论和方法在分析取样中的应用;分析取样的质量控制。为深入研究并完善分析取样理论做了评述及展望。

1 引  言
  分析化学中取样的重要性,人们越来越重视。Gy 在“分析化学的未来”一文,曾阐述了未来分析化学的主要任务应是如何减小取样误差从而提高分析结果的可靠性的问题〔1〕Kratochvil等对1984年前的取样学研究做过系统介绍〔2,3〕。我们曾对1995年前10年的化学计量取样学的进展进行了评述〔4〕,国内同行对工业分析中的制样〔5〕,取样及其质量控制〔6〕,样品粒度及取样量、元素的赋存状态对试样代表性的影响〔7〕也分别做了评述。但从分析化学的整体看,取样的研究远落后于分析技术和结果评价的研究,这与取样在分析化学中的地位是不相称的。
  分析化学的全过程是原始分析对象通过“取样”收集在样品中,然后经“测量”取得分析结果,进一步通过“数据评价”来反映该分析对象的信息。若假设分析化学全过程各步骤的误差彼此无关,根据误差传递理论,分析总方差应为各步骤方差之和,即总方差为取样方差与测量方差之和。目前对于测量方差而言,由于各种优秀的分析方法和先进的仪器,可使测量过程的方差降低到很小的程度。Youden早年就指出:当取样的方差是测量方差的3倍或更高时,进一步改善测量精度就显得不重要了〔8〕。因此如何改善取样的精度从而减小分析的总误差就是分析化学中取样所要研究的最重要课题。本文仅就分析化学的取样理论进行评述,以期对分析取样理论有一个较全面的认识,为深入研究并完善分析取样理论提供帮助。

2 取样误差与研究总体的理化性质间的关系
  取样误差的理论研究主要集中在固体物质的取样。取样总体的理化性质如组分含量的分布、粒度及其均匀度等都会直接影响取样误差。
2.1 二元颗粒混合物的取样
  二元颗粒混合物是比较简单的固体混合物,人们对此进行的取样理论研究比较深入,而且许多结论对于复杂混合物的取样也具有重要的参考意义。
  Benedetti-Pichler〔12,13〕应用二项分布理论推导出被测组分含量的取样相对标准偏差R的计算公式

  (1)

通过式(1)可计算出满足一定的取样相对标准偏差时所需的颗粒总数n

  (2)

式中表示二元颗粒混合物中被测组分的平均含量;w1、w2分别表示两种类型颗粒(A,B)中被测组分的含量;p、1-p分别表示两种类型颗粒在混合物中所占的颗粒数目百分数;d1、d2分别表示两种类型颗粒的密度;表示混合物的平均密度。
  式(1)是二元均匀混合物的取样公式,它假定两种颗粒的体积是均匀的。然而实际混合物并非完全如此,两种类型颗粒体积可能不等。为此,Zheng和Kratochvil〔14~17〕提出了扩展的Benedetti-Pichler公式

  (3)

式中c表示两种颗粒A和B的体积比c=v1/v2;n1、n2分别表示样本中颗粒A和B的数目。如果两种颗粒体积相等,可以证明式(3)和式(1)是等价的。
   我们曾证明〔18〕,式(3)可以简化为

  (4)

式中M1、M2分别表示两种类型颗粒的单颗粒质量,表示混合物的加权单颗粒质量=M1p+M2(1-p)。
  以上公式的另一个假设是每种类型的颗粒质量是均一的,但实际混合物中颗粒体积往往存在一个范围。为此Stange〔19〕应用二项分布理论提出了混合物中颗粒A的质量分数的标准偏差的计算公式

  (5)

式中fA表示样本中类型A颗粒的质量分数f=m1/m;x,y分别表示混合物中类型A、B颗粒的质量分数;m表示从混合物中抽取的样本质量;分别表示类型A、B颗粒的质量相对标准偏差;和分别表示混合物中两组分的质量标准偏差;和分别表示混合物中类型A、B的颗粒平均质量。Poole等〔20〕研究表明式(5)与下式是等价的。

  (6)

式中fi表示某一粒度范围颗粒i的质量分数(∑fi=1);Mi表示某一粒度范围颗粒i的平均质量;∑fiMi表示所有粒度的有效颗粒质量。式(6)通常被称为Stange-Poole取样公式。
  Benedetti-Pichler公式[式(1)]建立的是取样相对标准偏差与颗粒数目之间的关系,但实际取样往往是按质量取样。Wilson〔21〕提出了取样标准偏差与样本质量之间的关系式。Grant和Pelton〔22,23〕通过实验比较了3种计算加权颗粒体积的方法,发现应用加权颗粒体积比最大颗粒体积所计算的取样误差更符合实验结果;但由于Wilson公式假定两种类型颗粒的体积服从同一分布规律。因此其应用受到一定限制。相比之下,Stange-Poole公式较合乎实际。Zheng和Kratochvil〔17〕对Stange-Poole公式进行了扩展,提出了被测组分含量取样相对标准偏差的计算公式

  (7)

  按质量取样和按颗粒数目取样是两种不同的取样方式,我们曾对二元颗粒混合物的样本质量与颗粒数目之间的关系进行了系统研究,对按颗粒数目取样时样本质量的标准偏差与颗粒数目之间的关系以及按质量取样时样本中颗粒数目的标准偏差与样本质量之间的关系进行了考察〔24〕。我们还通过引入逻辑质量单元的概念建立了二元颗粒混合物按质量取样的相对标准偏差的计算公式〔25〕

  (8)

式中M0表示二元颗粒混合物的逻辑质量单元,它等于两种类型单颗粒质量的最小公倍数。研究表明,按质量取样时,取样量必须是逻辑质量单元的整数倍,否则将导致系统误差。
  当二元颗粒混合物中两种类型颗粒所占的比例差别很大时,其中一种颗粒仅占总体的很小部分,那么,这种微量颗粒的取样概率模型将不再是二项分布,而是Poisson分布。对此,Johnson〔26〕推导出了对微量颗粒取样的标准偏差与颗粒大小之间的关系, 

  (9)

式中m1表示样本中微量颗粒的质量;d1表示微量颗粒的密度;r表示微量颗粒的直径。Egermann〔27~30〕对式(9)的应用进行了研究,Zheng和Kratochvil〔17〕推广了Johnson取样公式,提出了微量颗粒被测组分含量的取样相对标准偏差公式

  (10)

  比较式(10)和式(7)发现〔17〕,当一种颗粒在混合物中所占的比例较小(如<1%)而且两种颗粒均含有被测组分时,式(10)较式(7)更符合实际。
  此外,Fricke等〔31〕还提出了二元颗粒混合物的最小取样量mmin与颗粒大小之间的关系,并应用药品混合物对公式进行了验证。
  需要指出的是,以上公式均指均匀混合物质的取样,对于集聚性(segregated)总体,取样性质将有所不同,因此,应用上述公式时必须慎重。
2.2 复杂混合物的取样
  自然界的物质通常比较复杂,对于固体可以看成是多种不同大小、不同组成的混合物,这方面的取样理论研究也很丰富。
  Wilson〔21〕研究了硅酸盐岩石的化学组成,依据多项分布理论提出了多颗粒混合物的取样公式,该公式确立了取样方差与岩石中所含各种矿物的理化性质(密度、组分含量等)及样本中的颗粒总数(n)之间的关系。

  (11)

  对于矿物颗粒大小不均匀的混合物,将颗粒数目n用加权倒数平均值代替,也可得到与式(11)相似的公式。
  式(11)在推导过程中对于颗粒数目和样本质量之间的关系做了一定近似,所以该公式较适用于取样量较大时取样误差的估计。
  Ingamells和Switzer〔32〕总结了前人的工作,提出了取样常数的概念,认为取样的相对标准偏差R与取样质量m之积为一常数。

Ks=R2m  (12)

式中Ks为取样常数,它表示68%置信度下取样的相对标准偏差达到1%时的取样量。式(12)适用于均匀混合物质,而且取样量需较大。Ingamells等〔33~36〕还提出了估计取样常数的方法和取样常数的应用。
  Gy〔37~39〕以地质矿产品为例系统研究了复杂颗粒混合物的取样,提出了取样方差与颗粒理化性质之间的关系。

S2=fgcld3/m  (13)

式中f为颗粒形状因子,它等于能通过某一特定筛子的最大颗粒的体积与能通过同一筛子的最大立方体的体积之比,一般取f=0.5;g为颗粒大小分布因子,可由物质的颗粒大小分析得到,一般取g=0.5;l为释放因子,等于被测颗粒的平均直径与混合物中最大颗粒直径之比的平方根,当被测组分完全游离时,l=1;c为组成因子,由下式计算

  (14)

式中dx、dg分别表示矿物和脉石的颗粒密度;如果f、g、c、l、d已知,即可计算一定取样质量下的取样方差。Ingamells-Switzer取样常数与Gy取样公式的系数之间的关系为Ks=fgcld32。
  总体上讲,取样误差是与被测组分在总体中的微观均匀度密切相关的。为此我们以碳化硅物料为例研究了粒度分布、被测组分随粒度的变化以及均匀度因子等,揭示了取样误差的本质〔40〕。
  以上理论都是指均匀混合物质的取样而言的。然而实际物质并不都是均匀混合的(well-mixed),即物质中的组分分布并不都是随机的。有时存在一定的集聚性(segregation),Visman〔41~43〕研究了集聚性总体的取样理论,提出了一个通用取样公式

  (15)

  式中A为均匀性常数(homogeneity constant),B为集聚性常数(segregation constant)。该式反映了集聚性总体的随机取样方差与取样量之间的关系,对于均匀混合物,B=0,均匀性常数与Ingamells-Switzer取样常数存在下列关系:A=1042Ks。Wallace和Kratochvil〔44〕详细研究了Visman公式,对集聚性物质化学分析取样方案的确立提出了许多有益见解,如对于集聚性总体,单纯增加取样量不能有效地减小取样误差,还必须增加份样数目。他们应用石油砂分析取样对该理论进行了验证。关于Visman取样公式在数学上的严密性已由Duncan〔45〕和Lerner〔43〕进行了评论。Brands〔46〕通过统计方法建立了非均匀颗粒物质取样方差与颗粒大小、颗粒数目和被测组分含量之间的关系,并将该方法扩展到集聚性取样〔47〕,提出了3种取样方案的取样方差公式,即单份样取样、多份样取样和多份样组合取样;并指出,对于未知分布的总体,无法给出一个通用的取样公式,但如果能够预先获知有关总体的信息将会有助于改善取样的精度。
  此外,Holcombe等〔48〕应用误差传递理论提出了悬浊液或泥浆取样的相对标准偏差公式

  (16)

式中为颗粒的平均质量;mT为样本中颗粒总质量,s为悬浊液或泥浆体积;f为颗粒中被测组分的质量分数;、Vn、Vs、Vf分别表示各参数的方差。
  如果被测组分在总体中的分布为正态分布,通过多个随机份样的平均(或组合取样)来估计原始总体中被测组分含量,那么,在一定置信度下,满足一定取样误差要求的最小份样数目(n)可由下式计算〔49〕

  (17)

当被测组分在总体中的分布为Poisson分布时(该分布常见于生物取样中),由于取样方差等于被测组分含量平均值,最少份样数目(n)由下式估计〔49〕。 

  (18)

  环境取样中还常见另一种分布即负二项分布,达到一定取样误差要求的最小份样数目(n)为〔49〕

  (19)

式中k为集聚指数,可通过实验测得。但是应予指出,公式(17~19)是基于将复杂的混合物问题简化,用宏观统计的方法近似解决该类问题,它并没有考虑试样中的复杂成分,所以问题的精确解还有待深入研究。
  此外,具有分立单元的总体(如袋装货物,瓶装药品,多车厢货物等),其分析总方差等于取样方差和分析方差之和。它由三项组成,即总体的不同单元之间的取样方差,同一单元内的取样方差以及分析方差,计算公式可见文献〔49〕。
  除了上述随机取样外,还有许多其它取样方式,相应的理论也是人们感兴趣的研究课题。
  组合取样,是指将多个随机样本组合成一个样本进行分析的取样方式。从理论上讲,如果忽略样本制备过程引入的误差,那么多份样的平均与组合取样的误差是等价的,很早人们就认为组合取样方差sc2等于单份样方差So2除以份样数目N〔5〕。

  (20)

  我们对该公式的理论基础进行了深入研究〔50〕,探讨了组合取样常数的概念和意义,并应用Monte Carlo法对组合取样进行了模拟。此外,将总体分为若干子区,组合取样方差与被测总体的理化性质(如组分含量和子区的质量分数等)之间的关系式也已导出〔51〕。
  分层取样,是指被测组分在总体中的分布不是随机的,而是可以分成若干层,层内物质相对均匀,而层间物质组成差异相对较大。由于分层取样误差仅包含层内取样误差而不包含层间取样误差,所以分层取样的精度优于随机取样〔15〕。假设各层的大小不同而随机取样方差相等,那么为使取样方差达到最小,在各层内抽取的样本数目应与各层的大小成正比。如果各层的大小也相等,那么总方差等于层内取样方差S2(intra)除以总样本数目N。
  由于通常所遇到的总体不仅各层大小不同,而且各层的取样方差也不同,为此,我们深入研究了颗粒混合物的分层取样,提出了分层取样最优化方案〔52〕。当总的分层取样方差最小时,各层的取样量mi与总取样量m存在下列关系。                  

  (21)

式中fi为第i层的质量分数;wi为第i层中被测组分含量;Ksi为第i层的Ingamells-Switzer取样常数,r为总层数.在文中也导出了分层取样方差的最佳水平关系式。

3 现代数理统计方法在分析取样研究中的应用
  自然界物质分布是复杂的(如地质资源、环境、土壤、生物等),因此应用简单的统计模型难以准确地反映客观实际。现代数理统计方法应用于取样学的研究日趋活跃。
  Massart等〔53〕应用多变量校正和模式识别方法探讨了从总体中抽取的样本组的代表性问题,通过研究两组样本数据的方差和协方差矩阵的矩心、Mahalanobis距离等提出了几个考察样本代表性的定量判据。Danzer等〔54〕应用多元统计方法研究了河水分析中的取样问题,考察了水中11种元素组分的时空变化,通过因子分析、多维方差分析及判别分析等方法探讨了组分含量的明显波动与水质的人为污染之间的关系,对水质分析的合理取样提供了重要参考依据。
  Geiss等〔55〕应用多元相关分析技术探讨了环境分析中的取样,考察了河水中重金属的迁移速率和悬浮物的取样频率。Krieg等〔56〕应用多元统计方法(如聚类分析、因子分析、判别分析、多维方差分析等)研究了土壤重金属的分布。Daus等〔57〕应用化学计量学方法(如聚类分析、协方差分析等)研究了河流沉积物重金属的分布状况,探讨了取样条件对分析结果的影响。
  Gy取样理论研究的重要内容之一是变分法 (Variography)〔58,59〕,对于一维(时间序列)总体,通过计算与取样间隔有关的变分量 (variogram) 反映总体的自相关性、单维非均匀度及周期性波动等信息,并提出了系统取样和分层取样方差的估计方法。 变分法的一个重要参数就是取样间隔为零时的极限变分量,Heikka等〔60〕对几种估计极限变分量的方法进行了比较。
  地质统计法(geostatistics) 最早是用于地质储量估计的一种方法〔61〕。Enix等〔62〕应用地质统计法和二维方差分析法研究了水系沉积物的均匀性和取样代表性问题。他们还对受污染土壤的调查进行了地质统计分析,确定了有代表性地描述某地区环境状况的最小取样数目〔63〕。
  此外,使用计算机模拟法 (如Monte Carlo法)可以对实际取样误差进行数值估计,也可以对经典取样理论进行验证。Mestek等〔64〕曾应用计算机模拟法研究了矿石的取样方案及其对分析结果精度的影响,并与取样常数理论和Visman理论的计算结果进行了比较。我们应用Monte Carlo法研究了组合样本中被测组分含量的置信区间〔65〕。Henrion等〔66〕以土壤重金属取样为例应用计算机模拟法(非参数估计法)探讨了代表性取样量的置信区间,并与参数法结果进行了比较。

4 取样的误差分析及其质量控制
  取样和样品分析是分析全过程的两个相互独立的步骤,有关实验室分析的质量控制理论日趋完善,但对取样的质量控制研究还刚刚开始〔67〕。Thompson等〔68〕将分析的质量概念和研究方法推广到取样,表明两者无论在理论上还是在实践中都是合理的,但某些具体内容可能有些差异。这些概念和方法包括:真值、误差、偏差、准确度、精密度、不确定度、溯源性、适目的性、参考取样目标、协作试验、水平测试及内部质量控制等。Valcarcel等〔69〕专门研究了包括取样在内的溯源性(Traceability)问题。Ramsey等〔70〕研究了受污染地区重金属分析中的取样,对4种不同取样方案的取样偏差进行了比较,探讨了取样中选取参考取样目标的可行性。Ramsey〔71,72〕研究了地质分析中取样的不确定度问题。Argyraki等〔73〕还将水平测试法(proficiency testing)应用于不同方法和人员对取样的质量评价。
  由于稳健方差分析法(robust ANOVA)〔74,75〕较传统方差分析法(classical ANOVA) 在处理离群值问题上具有优势,因此,取样中采用稳健方差分析法的研究也很活跃。Ramsey等〔76〕应用稳健方差分析法探讨了大豆叶中铝的分析质量控制和取样,Ramsey等〔77〕还提出了地球化学分析中取样和分析的质量控制方案。我们曾应用稳健方差分析法探讨了土壤取样〔78〕。Thompson等〔79〕研究了土壤中痕量组分分析中的取样精度,并对传统方差分析法和稳健方差分析法的结果进行了比较。
  我们曾应用F-检验法对分析方差和总方差进行了比较〔80〕,提出了均匀混合物临界取样量msc的计算公式,临界取样量表示总方差与分析方差无显著性差异时的最小取样量。

msc=Ksw2s-2a(F1-α-1)-1×10-4  (23)

式中sa2为样品分析方差,F1-α表示1-α置信度下F-检验临界值,Ks表示取样常数,w为被测组分含量。
  有人还对取样进行了经济分析,设计了一定总费用下使总方差最小的最佳方案〔15~18〕,计算取样、次级取样及样品分析数目的有关公式请参考原文。
  此外,Thompson等〔82〕还基于实用目的研究了取样和分析的费用最佳分配,计算了相应的取样和分析方差值。
  取样的质量保证有两个方面的内容,除了保证取样误差满足一定的预定要求以外,对于取样误差的估计也必须是准确可靠的,二者缺一不可。对此我们考察了取样方差估计值的精度,探讨了取样方差估计值的标准偏差与所取样本数目之间的关系〔83〕。

5 分析化学取样研究展望
  从分析化学取样研究的现状看, 虽然人们对该领域的兴趣日益增加,但研究工作还不够深入,研究范围、内容及方法还比较窄, 尤其是有关分析取样的理论问题还远未解决,国内这方面的工作则刚刚起步。分析化学中的取样研究是一个综合性很强的课题,它不仅仅是化学与数理统计方法的结合,还与所研究的对象如地质、环境、材料、生物等方面的理论和研究方法密切相关。通过越来越多的分析化学和相关领域工作者的共同努力,应用现代数理统计和相关学科的理论和方法,进一步揭示取样规律,探讨取样误差与分析对象的理化性质之间的关系。通过这些基础工作,我们期望分析化学取样的研究能达到一个新的水平。

本文系国家自然科学基金资助课题(29575200)
作者单位:高志(南开大学化学系, 天津 300071)
     何锡文(南开大学化学系, 天津 300071)
     李一峻(南开大学化学系, 天津 300071)
作者: 高志何锡文李一峻 2007-5-18
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具