医学统计学方法基本概念与正确选择 2007年第7卷第9期 | 39康复网

【关键词】 统计学；随机对照试验；统计学分布

Concept of methods of medical statistics and correct use of statistics.

　　CUI Rong.

　　（Hainan Medical College, Haikou 571101, Hainan, P. R.China）

　科学性是衡量文章提出的结论是否成立的基础和前提，正确的应用医学统计学方法又是保证科学性的主要环节。本文试图针对当前医学论文中存在的几个问题谈谈认识。

　　1 基本概念

　　1.1 样本的选择样本的选择实际上是在总体中的抽样过程，必须抽取足够量的样本具有代表性，才能客观地反映总体的特征。目前存在的主要问题是随机化方法不够完善，有的甚至出现“随意抽取”的描述［1］。有的即使交待了随机抽样，也往往只提及“随机分成”几组，而不交待抽样和分配的具体方法。实际上从整个论文看，很多作者对随机分组的意义和方法并不深入了解，有的即使知道随机分组的原则，但因为怕麻烦，而没有认真实行；有的甚至仅仅为了提高论文的利用率而冠有随机化的字眼。上述问题在实验设计比较周密的前瞻性研究中出现得较少，而在临床回顾性、经验总结类文稿中表现比较突出。为了解决上述问题，编辑部在审稿时应有意识地要求作者补充研究对象随机化抽样和分配的具体方法。前者如单纯随机抽样、机械抽样、分层抽样、整群抽样等；后者如完全随机化设计、随机区组设计、拉丁方设计、序贯设计、正交试验设计等。对于回顾性研究，作者在总结前就应对原始资料的同质性、完整性、周期性作出准确的判断，特别要考虑到因时间跨度、科学技术的发展而带来的影响。

　　1.2 设立可比性强的对照组第一，医学科学研究设立对照组非常重要。一些科研论文科学性不够强的主要原因是对照不合理，有的甚至根本不设对照组。医学科学研究的对象是人，很多疾病如感冒、气管炎、关节炎、早期高血压等，都可能因休息、营养、气候等因素的影响而自然缓解和自愈，如果不通过严格对照试验，就很难作出正确判断。例如，美国曾有人为了试验普通感冒疫苗的预防效果，将一批大学生随机分成疫苗注射组和对照组（注射生理水），实验结果表明，当年注射组感冒的发病率减少了73%，可是对照组也减少了63%，经统计学处理后两组效果无显著性意义［2］。上述试验倘若不设对照，会得出错误的结论。第二，虽然有对照，但缺乏可比性。严格地讲，实验组和对照组，除两组处理因素不同外，其他各方面的因素都要一致。为消除其他因素可能对结果产生的影响，应对其作均衡性检验。通过观察，作均衡性检验的只是极少数。拿他人、他地、他法的实验结果，不加分析的与自己的实验结果相比较显然是不妥的，应针对均衡性检验的不同结果，选择合理的统计处理方法进行分析［3］。第三，两组例数相差悬殊。就统计学的基本原理而论，无论是实验组还是对照组，例数太少，误差率就会加大，两组例数相差太多，可比性就会减弱。有的论文样本例数只有几例，就很难说明问题。有的实验组上百例，而对照组仅十几例，显然是不合理的。最佳的应该是两组例数相等或者相近，因为这时两组间的合并误差最小，差值的显著性最高［3］。关于受试对象的例数，古典统计学认为，例数越多越好，现代统计学则强调精选择本。一般来说，计数资料每组样本不得少于20～30例，计量资料每组样本不得少于5～10例［4］。针对以上情况，当前应注意的是，凡科学研究性的、临床用药方面的论文均应设立对照组，同时要求设对照组的标准和具体方法，以便从整体上提高科研论文的水平。

　　1.3 P值的表达在医学论文中，P值的意思是在原假设成立的前提下，观察到的试验差别由于“机遇”所致的概率。P值越小，拒绝原假设，认为分组因素与试验差别有关联的统计学证据充分。当随机分配处理时，分组因素与试验差别的关联可解释为因果关系。当前的研究论文中P＞0.05称为“不显著”，0.05＞P＞0.01称为“显著”， P＜0.01称为“高度显著”。实际上，这是个大的误解［5］。误解的原因是以往无法精确的计算P值。事实上，从80年代以后，随着计算机的普及，各种检验方法，如χ2、t、F检验，都可以得出精确的P值，无须再用查表的方法确定P值的范围，因而也就没有必要将0.05和0.01看作两个特殊界值，比如，利用计算机可以算出P=0.052, P=0.048。这样，研究人员就可根据已有的证据对各个具体情况作出自己的判断，而不必不顾具体情况用一个固定的界值，去拒绝原假设。比如P=0.052和P=0.048，在统计学上都是小概率，但以0.05为界时前者为“不显著”，后者为“显著”，结论截然相反。目前，国外医学期刊已提昌刊出精确P值，国内一些医学期刊亦开始这样做，以让读者根据具体条件对试验结果的可靠性作出自己的判断。实际上，国内已完全有条件这样做。如条件达不到时，P值仍需通过查表获得，但最好在给出P值范围的同时，刊出相应的χ2值或t值，因为χ2值或t值越大，P值越小，反之亦然。如P=0.05时，χ2为3.84，然而χ2=3.80时，P值虽大于0.05，但仍在0.05附近，再根据自己的专业知识判断原假设是否正确。

　　2 统计学方法的选择

　　2.1 参数检验与非参数检验方法资料类型不同所选检验方法不同。一般来说，计量资料、计数资料，属参数检验；等级资料方差不等时的两样本计量资料属非参数检验。确定计量资料后，又应注意是否属单因素分析，样本含量较小时，确认该组资料属正态分布为特征后，才应用t检验。若资料为非正态公布，可采用t′检验或可采用数据变换的方法，尝试将资料变换为正态分布资料后进行t检验。在t检验过程中需注意的另一个概念性问题是根据研究的目的和专业知识选择进行单侧检验或双侧检验，错误的套用不同研究对象，可能导致错误的结果。如：血糖过高或过低均会导致患者疾病，这种情况应进行双侧检验，而如尿素氮只有超过某一界限为不正常，而没有下限，这种情况应选择单侧检验。而在众多文献中，极少有人在统计学处理中提到相关的单侧或双侧检验方式。若所观察的对象为两组以上或多组的单因素分析，则应用F检验（方差分析）。等级资料或方差不等时两样本计量资料应用秩和检验。计数资料属二项分布，应用卡方检验。

　　2.2 多因素多水平资料的统计学方法选择在实际临床工作中，往往会有许多多因素多水平的问题需要进行分析，如：中医中药治疗某种疾病，有9种中药，这就是所谓9种因素，而每种中药用量又有3个不同的量，可谓是3个水平。又如对某种疾病治疗联合用药，观察疗效，若联合4种药物，每一种治疗药物又分二种不同剂量、配伍用药，那么，这就属于4因素2水平问题。这种多因素多水平的计量资料选择常用的t、F等检验是不恰当的。为了解决分析这种类似的资料进行检验，应选择正交试验设计方法［5］。可以快速有效的得出正确结论。

　　2.3 对特定的单独资料的统计学方法在实际临床工作中，往往还存在另一种情况，比如：对某地区普查疾病中发现罕见8例先天性颈部半椎体畸形，考虑和本地区家族遗传基因有关，观察指标明确，但例数少，无法用固定样本方法进行统计学处理，在这种情况下，可选用医学序贯试验方法。序贯试验方法是用最少样本，能快速得出结论的统计学方法。

　　3 结论

　　以上所提及的有关医学统计方法的基本概念与正确选择的内容，因为篇幅问题，只能原则的说明，尤其谈到正交试验设计和医用序贯设计，只能皮毛的谈到选择，而具体的应用还须医务工作者做大量的工作。

【参考文献】
　［1］史红，姜永茂，游苏宁.重视医学论文中有关统计学分析的描述［J］.编辑学报，2006，18（3）：189～192.

　　［2］杨云华.医学论文中常见的统计学错误及对策［J］.中华医学科研管理杂志，2004，17（2）：107～108.

　　［3］史宗道，罗德诚.对6种中华系列临床医学杂志3年中部分病因学研究论文的方法学评价［J］.华西医学，1999，14（3）：257～259.

　　［4］胡良平.医学实验中常见设计类型的辨析及统计方法的合理选用［J］.中国应用生理学杂志，2000，16（1）：87～91.

　　［5］陈彬.写作统计学［M］.成都：四川科技出版社，1996，120～127.

作者单位：海南医学院学报编辑部，海南海口 571101.

作者：崔蓉 2010-1-13