微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 行业资讯 > 非诊断试验中的多重比较----多个平均值两两比较方法

非诊断试验中的多重比较----多个平均值两两比较方法

文章来源:www.3618med.com发布日期:2013-06-19浏览次数:30064

        多重比较从功能上讲主要分为两类,粪即任何两个均数之间都要进行比较;第二类为 多个试验组均数之间不比较,但需要将各试验组分别与同一个对照组均数比较, 设某试验因素有k个水平,也就是有k个均数,第i组和第j组的总体均数分别为μi和 μj,样本均数分别为 和 ,样本例数分别为ni.和nj,,MS误差为某种特定试验设计定性资料 方差分析中的误差均方,误差项的自由度为v误差 
        (一) 所有处理组与对照组均数的比较 在很多研究中,分析的目的是比较多个处理组与个对照组均数之间差异有尤统计学意 义,在试验因素的k个水平中,有k-l个处理组和一个对照组,此时只需要进行k-l次捡验 即可。常用的方法为Dunnett’s t检验法,它是t检验法的一种修正。 假设μ0为对照组对应的总体均数, 与n0分别为对照组的样本均数和例数,μi为第i个 处理组的总体均数,i=1,2,…,k-l.则原假设和备掸假设分别为:
        H0: μi=μ0 
        H1: μi≠μ0


 

        计算出检验统计量后,将其与Dunnett检验的临界值da/2(k-1,v)比较,临界值可以从
        Dunnett检验专用的界值表中查得,由检验的显著性水平α,处理组个数k-l和自由度v确 定。需要注意的是,该界值丧有单侧和双侧之分。对于双侧检验,当显著性水平a=0. 05时,若 有|t|≥d0.05/2(k-1,v),.则P≤0.05。如果在专业上有明确的证据,已知处理组均数不会大于或小 于对照组均数时,可以进行单侧检验。SAS软件可以进行Dunnett法的单侧和双侧检验。 上述假设检验可以用置信区间的形式表达,两总体均数差值μi-μ0的双侧100(1-α)%避信区问为:


 

        同样,对于单侧检验,可以计算相应的单侧100(1-α)%置信区间,置信区间的结论与假设检验是一致的。 Dunnett检验控制大试验误差率在不超过事先给定的α水平上。

        (二)所有组之间的两两比较

        所有组之间的两两比较的方法较多,下面分别给出简要介绍。

        1. LSD法 LSD法也称小显著差异法(least significant difference),适用于一对或几对在々业上有特殊意义的总体均数间的比较。当某种特定试验设计定量资料方差分析的结果表明某因素各水平组的均数之间的差异有统计学意义时,使用LSD法作进一步的分析。检验统计量的计算公式为:

        用这种方法做比较的次数越多,试验误差率就越大,即做完全部比较所犯Ⅰ类错误的概率就越大。

        2. Bonferroni法 Bonferroni提出,如果在α’水准上进行c次假设检验,当原假设为真时,至少有一次拒绝原假设的累积Ⅰ类错误概率,即做完全部比较所犯Ⅰ类错误的概率a不超过c×a’,也就是有不等式a<c×α’。因此可以重新选择I类错误概率水准α’,以便使试验误差率a控制在规定的水平之内。取α’=α/c,当因素有k个水平时,c=k(k-1)/2,则有 α’=2α/[k(k-1)]。假设事先规定α=0.05,另外k=3,则比较的总次数c=[3×(3-1)]2=3, 每次进行比较的检验水准α’=0.05/3。=0. 016。 用Bonferroni法进行多个平均值之间两两比较的检验统计量计算公式同式(8-4),就前一段中的例子来说,每次进行比较的临界值为t0.016/2,v,对于双侧检验,若检验统计量| t |≥ t0.016/2,v ,则P≤0.016,两个均数的差别有统计学意义。 当比较次数不多时,Bonferroni法的效果较好;但当比较次数较多(例如在10次以上)时,由于其检验水准选择过低,结论偏于保守,
        3.Sidak法与Bonferroni法类似,根据Sidak的不等式同样可以对t检验法进行校正, 规定每次进行比较的检验水准α’=1-(1-α)1/c仍沿用前例,α’=1-(1-0.05)1/3=0 017, 对于双侧检验,若检验统计量| t |≥t0.017/2,则P≤0 017,两个均数的差别有统计学意义。

        4. Scheffe法 它是由Scheffe于1953年和1959年提出的控制试验误差率的方法,其检验统计量为F,计算公式为:

        其中t的计算见式(5-4)。当F≥Fα(k-1,v)时,认为两总体均数的差异有统计学意义。 Scheffe检验的结果与多组平行组设计定量资料方差分析的结果是相容的,即若方差分析的结果有统计学意义,则用此法至少能发现一次比较的结果有统计学意义;反之,若方差分析 的结果为无统计学意义,则用此法也找不出任何两个均数之间差别有统计学意义(然而,大部分多重比较方法可能会发现某些对比组之间差别有统计学意义)。 如果比较的次数明显地大于均数的个数时.Scheffe法的检验功效可能高于Bonferroni法 和Sidak法。


        样本含量相等时,Gabriel法与GT2法是等价的;样本含量不等时,Gabriel法比GT2法 具有更高的检验功效,但当样本含量相差悬殊时,此法可能变得不精确。 8多级检验(MultipLe-Stage Test)多级检验方法可以分为步长增加法和步长减少法, 其中步长减少法应用较为广泛,SAS/STAT中采用的也是此法,这里主要就步长减少法的基 本步骤及各种方法作一简要介绍。 沿用前述中的假设,有k个均数需要进行比较,则步长减少法的具体步骤为;
 



        Duncan法功效较高,电就是说,当真正存在差异时,这一方法能把均数间的差异有效检测 出来。如果不考虑较高的I型误差率,则此法优于Tukey法,正因为如此.Duncan多重极差检验法应用较为普遍。 (2)SNK法:该法即Student-Newman-Keuls法,又称q检验。它和Duncan法相似,不同之处在于临界值的计算稍有不同,其对应的rp=α。检验统计量的计算与Duncan法完全相同,算得学 生化极差统计量后,如果q≥qa(p,v),则P≤α,两总体均数之问的差别有统计学意义。 SNK法比Duncan法保守,它的L类错误概率较小。特别是,对所有涉及相同均数个数的检验,比较的Ⅰ类错误概率都是n。因此,由于a-般说来较小,SNK法的功效通常比Duncan检验法为低。 另外两种多级检验法不像Duncan法和SNK法那样出名,但它们却是到20世纪70年代为止文献中介绍的有效的步长减少的多级检验法,它们是REGWQ法和REGWF法.由 Ryan(1959,1960)、Einot和Gabriel(J 975)、Welsch(1977)研究出来,其中rp。由下式定义:

        (三)两两比较的Bayes方法
        多个平均值之问的两两比较也可以采用Bayes方法,也就是Waller法,由Waller和Dun-can( 1969)采用。它不是控制犯Ⅰ类错误的概率,而是在附加损失条件下使Bayes风险达到小值。该法的假定条件是:各组总体均数具有未知方差的先验正态分布,均数的方差的对数具 有先验均匀分布。检验的原假殴和备择假设分别为:


 

        则拒绝H0,说叫两总体均数之间的差别有统计学意义。这里圯是Bayesian t值,它依赖 于常数K、单因素多水平设计定量资料古差分析的检验统计量F及其自由度。tβ的值是F的 单调减函数,故当F统计量增加时,Waller-Duncan检验,即Waller法变得不精确。

        (四)析因设计方差分析中的多重比较 在多因素析凶设计中,在方差分析的基础上,也可以进一步对各因素不同水平进行两两比较。当交互作用尤统计学意义时,可以直接别处理因紊各水平的平均值进行比较;当交互作用 有统汁学意义时,直接对各因素主效应诸均数比较时,可能被交互作用所掩盖,在这种情况下,ur将一个因素或多个因索的组台固定在一定水平上,然后对需要比较的那个因索进行均数间 的两两比较。率市以两因素析罔设汁为例,结合Tukcv法说明具体的比较过程。
 



 

 

 

        本倒数据经检验符合正态性和方差齐性,首先进行多个平行组设计方差分析,在此基础上 进一步对3个试验组和对照组进行比较,使用SAS中的GI,M过程,即一般线性模型过程。 本例用group表示不同试验组。Means语句之后的选项指定分别使用I,SD法、Bonferro-ni法、Scheffe法、Tukev-Kramer法、SNK法和Bayes方法进行两两比较。 用GLM过程进行试验组与对照组均数比较的程序(程序名CT8-l)如下:

        主要输出结果及结果解释:

        程序及输出结果的解释与结论:本例用group表示处理因素,由1到4分别代表对照组和3个不同的试验器械组。选项dunnett指定进行双侧检验,也可以用选项dunnettl(当试验组均数只会小于对照组均数时用)或dunnettu(当试验组均数只会大于对照组均数时用)说明进行单侧检验。 Dunnett检验的输出结果主要包括两部分,部分首先说明该检验控制试验误差率,给出一些统计量的值,包括显著性水准α=0. 01.误差的自由度。ν误差=32,误差均方MS误差=1. 27,检验的临界值以及小显著性差异值;第二部分为各试验组与对照组比较的情况,用“***”号说明所比较的两组之间差异有统计学意义,可以看到,3个试验组只有第2个试验 组与对照组之间的差异具有统计学意义,同时也给出两个均数的差值以及差值的99%置信区 间。这里将各差值的值与小显著性差值进行比较也可以看到,第二个试验组与对照组 均数差值的值大于小显著性差值1.667 5,差异有统计学意义。此外,根据置信区间也 能够得到相同的结论。 结论:3个试验器械x线机,第2个与对照组读片清晰度存在差别,其他类与对照器械相比无差别。

        【例8-2】使用【例8-1】数据,比较4组(3个试验组,1个对照器械组)平均值之间差异 有无统计学意义。 本倒数据经检验符合正态性和方差齐性,首先4个平行组之间的方差分析,在此基础上对所有处理组进行两两比较,仍然使用SAS中的GLM过程。 用GLM过程进行所有处理组两两比较的程序(程序名CT8-2)如下:

        主要输出结果为

        以上为Bayes方法,即WallerDuncan检验的结果。一开始说明它是在附加损失条件下 使Bayes风险达到小值,接着给出Kratio值、误差自由度、误差均方、F值、检验的临界值和小显著性差异,其中Kratio值是Waller-Duncan检验两类误差的重要比例,Kraiio的合理值 为50,100,500,大致相当于两水平情况下的α为0. 1,0 .05和0. 01,默认值是100,此处是默认值。结果中指出不同组别间用相同的字母标示差异无统计学意义,提供各组的均数,并按照均数由大到小的顺序对各组进行排列,本例组和第4组(对照组与第3试验组)之间的差别 无统计学意义,第1组、第二组和第3组(对照组,第1试验组,第2试验组)两两之间的差别均有统计学意义。


        以上给出的是I,SD检验的结果,说明它只控制比较误差率,而不是试验误差率。结果部分大体与前面类似,第1组和第4组(对照组与第3试验组)之间的差别无统计学意义,第1组、第2组和第3组(对照组,第1试验组,第2试验组)两两之间的差别均有统计学意义。

        第3个结果使用的是SNK法,它控制的是在完全无效假设下的试验误差率。使用SNK洼有多个临界值,本例中存在4个平行组,所以存在3个临界值,结果中列出了包括不同组数时对应的临界值,检验的结论与Waller-Duncan检验相同。


 

        以上结果分别列出Tukey_Kramer法与Bonferroni法的结果,它们都是控制试验误差率, 但是与REGWQ法相比,它们通常有一个更高的Ⅱ类错误的概率,检验的结论与Waller-Dun一can法及SNK法相同

        后给出的是Scheffe检验的结果,此法要求比较严格,临界值普遍较大。在大部分多重 比较方法可能会发现有统计学意义的差别的对比组时,Scheffe法有可能找不出任何两个均数 之间差别有统计学意义。在本例中,结果与前述方法一致。 结论:综合上述几种多重检验方法的结果,对照组与第3个试验组之间没有差别,第1试 验组、第2试验组与对照组两两之间均存在差别。