微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 行业资讯 > 医疗器械临床研究试验设计----平行组设计

医疗器械临床研究试验设计----平行组设计

文章来源:www.3618med.com发布日期:2013-06-14浏览次数:30242

        一.当仅考察一个因素,该因素分成若干个水平,将受试对象随机的分配到各个水平组中进行试验,这种试验没计类型称为平行组设计(parallel group design)。平行组殴计中,各组受试者 在试验中处于相同的条件,的不同点是各组所使用的器械不同,如有的是试验器械,有的 是对照器械,后根据试验结果作出统计分析。平行组设计是所有试验设计中简单、也是常见的一种试验设计类型。 
        通常,根据试验方案的需要,可为试验组设嚣一个或多个对照组,试验器械也可按照若干种治疗强度设组。对照器械的选择应符合试验方案的要求。对照组可分为阳性或阴性对照。 阳性对照一般采用按所选适应证的当前的有效器械,阴性对照一般采用疗效未被业界证实的安慰器械,但必须符合伦理学要求。

        【例4-l】本临床试验采用多中心、单盲、随机对照方法,验证西罗奠司(雷帕霉索)可降解 涂层钻铬合金冠状动脉药物洗脱支架系统的有效性和安全性,评价该支槊的输送系统。与药 物洗脱支架进行对照。按照人选和排除标准选取合适患者参加本次验证,对所有人选患者在270d(士30d)时进行造影随访,以标准的定量冠状动脉造影(QCA)评测获得的晚期管腔丢失 为主要疗效指标以评价试验产品的有效性。以试验随访过程中的主要心脏不良事件( MACE)为主要安全性指标以评价试验产品的安全性。

        【例4 -1分析】本研究是一个平行组设计,试验器械为“NOYA雷帕霉索可降解涂层钴铬合金冠状动脉药物洗脱支架系统”,对照器械“Firebird2药物洗脱支架”,主要终点为定量冠状动脉造影(QCA),各中心内比较,可使用f检验,如不满足参数检验条件,可使用相应的非参数方法;中心间比较为在检验各中心方差齐性后,使用调整中心效应和基线效应的协方差分 析。两组心脏不良事件( MACE)的比较可采用定性资料统计分析方法,CMH(Cochran Mantel-Haenszel) X2检验。
        二、非劣效临床试验设计
以安慰剂作为对照的随机双盲试验在临床试验中通常被视为金标准。但随着医疗技术的发展,越来越多有效产品的出现,开发疗效有突破的新产品变得十分困难。尤其在医疗器械临 床试验中,当现有的治疗手段可以为患者捉供很大的生存获益时(例如,延长生存时间或防止不可逆的损伤),单纯地使用安慰剂、空白对照或者低剂量的对照既不符合伦理要求,也无法比较新产品与已l上市的产品之间的优劣。基于这个原因,现在国内外的医疗器械临床试验大都采用了非劣效试验的设计。但遗憾的是目前一部分采用非劣效设计的试验往往存在着适用条件不符合.阳性对归照选择错误.界值确定不合理等渚多问题,笔者参考了众多文献并结合实际工作中的一些经验.以期为国内正确设计非劣效试验提供参考。
         (一)优效性试验与非劣效性试验的比较
        优效性试验是指事要研究目的是显示所研究的产品疗效优于对照产品的疗效(阳性或安 慰剂对照)的比验。现在常用的4种用来验证有效性的平行对照试验类型,其中有3种是优效性试验-----安慰剂对照,空白对照和剂量组间列照。第4种是非劣效试验,采用阳性药物对照 组与试验组比较。如果试验曰的是为了验证试验组比阳性药物组更有效,那么可以采用优效性设计。但['l讨更普遍的情况足用来验证试验组与阳性对照组之间的差别不大,在一定程度 上可以认为他们的疗效没有本质差异。这里差别不大的概念是指试验组比对照组疗效差,但差的程度非常小,小到可以认为与阳性对照组相比,试验组依然是有效的。如何殴汁和解释这 样的试验,使E能达到I:面所说的要求是一个很艰巨的挑战。 
        优效性试验与非劣效性试验大的区别在于,一个设计合理执行良好的优效性试验可以 在不做进-步假设的前提F,完整地解释显著性检验的结果;也就是说,试验结果本身就可以 说明问题,不需要参考其他信息。而非劣效性试验是建立在一些非本试验的信息上的,即阳性 对照组的预期疗效。如果在非劣效性试验中阳性对照组完全无效(完全没有预期的效果),那 幺即使试验绑勺阳性对照组只有很小的疗效差异也是毫无意义的,没有任何证据可以表明试验组是有效的。非劣效试验很大程度上依赖于外部信息,它需要参考历史对照试验的数据。

        (二)非劣效界值的选择
        非劣效试验旨在验证阳陛对照组与试验组之间疗效的差异(对照组优于试验组的部分)小 于预先制定的非劣效界值。在非劣效试验中,非劣效介值不能大于对照组预期的效应,这种基 于对照组效应|殳定的界值通常称M1。M1不是从非劣效试验中得到的,设定时应参考对照组以前做过的一个设计良好的安慰剂对照试验的结果或综合多个试验结果进行me[x]ta分析。 
        为了方便表达,我们将高优指标定义为数值越大疗效越好,低优指标定义为数值越小疗效 毽好,比如有救牢是高优指标,死亡率是低优指标。若记非劣效界值△>0。 非劣敛临床试验的检验假设:
        1.高优措标 H0:C-T≥△,△>0
        H1:C-T<△ 或 H0:In(C/T)≥△,△>0
        H1:In((C/T)<△ 2.低优指标
        H0:T-C≥△,△>O
        H1:T-C<△ 或 H0:In( T/C)≥△,△>0
        H1:In( T/C)<△ 
        对高优指标,取(C-P)区间下限作为阳性对照的疗效估计,记为M(可以认为本次试验中的
阳性对照的疗效有97. 5%以上的可能大于M)。若取M1<M,令△=M,如果拒绝H0,则可间接推论出试验组疗效优于安慰剂,即C-T<△ <=>T-P> C-P-△>0;若取M2 = (1-ƒ)M1, 0 <f <l,令△=M,,如果拒绝H.,则可推论出试验组非劣效于阳性对照,且至少保持了阳性 对照疗效M的ƒ,即C- T<△<=>T-P>C-P-(1-ƒ)M1<=>T-P>ƒ(C- P)。 
        对于低优指标,构建(P-C)区间估计后,取区间下限作为阳性对照的疗效估计,记为M。 若取M1<M,令△=M1,如果拒绝H0,则可间接推论出试验组疗效优于安慰剂,即T-C<△<=>P-T>P-C-△>0。若取M0=(1-F)M1,o< ƒ<1,令△=M2,如果拒绝H0,则可 推论出试验组非劣效于阳性对照,且至少保持了阳性对照疗效M的ƒ,即T-C<△<=>P-T> P-C-(l-ƒ)M1<=>P-T>ƒ(P-C)。 
        以下就高优指标给予详细说明:
        在一个安慰剂对照试验中,无效假设(H0)是指试验组(C)的效应小于等于安慰剂(P)的效应;备择假设是指试验组的疗效大于安慰剂的疔效。 
        H0:C≤P;C-P≤0
        H1:C>P;C-P>0
        多数情况下,统计学上是通过C-P的双侧95%可信区间的下限>0来确定治疗结果的有效性(相当于单侧97. 5%可信区间的下限)。这表明了试验组的疗效是>0的。见图4-1


 

        C-P的95%CI下限值>0时,拒绝H0,说明试验组的疗效优于安慰剂。取(C-P)区 问下限作为阳性对照的疗效估计,记为M(可以认为本次试验中的阳性对照的疗效有97. 5%以上的可能>M)。为保守起见,建议M1要小于置信区间下限值。取M1<M,令△=M1。
         在一个非劣效试验中,无效假设是指对照组(c)与试验组(T)的疗效差(C- T)大于非劣效界值M1,其中M1代表阳性对照组与安慰剂间的疗效差即阳性对照组的疗效。 H0:C-T≥M1(试验组比对照组的差,且差距≥M1) H1:C-T< M1 (试验组比对照组的差,差距<M1)
        当C-T的双侧可信区间上限 如果对照组此试验组的疗效好,且差值>M1,那么该试验药就被认为没有疗效。
        因此,我 们用对照组与试验组的差值(C- T) <M1,来说明药物的有效性,可以用C-T的95%置信区 间的上限<M1来判断。 M1的确定是其中关键的问题,它不是通过非劣效性试验得出来的(没有设置相应的安慰剂对照)。它的估计需要综合考虑既有阳性对照试验的结果以及考虑历史试验和现试验之 可条件环境上的差异。 选定非劣效界值的第二步是设定临床认可的较对照组差的大值。虽然M1的非劣效性 检验能够保证试验组比安慰剂好,试验组的效果>0。但在很多实例中,这并不能保证试验产品的有效性具有临床意义。应用非劣效性检验设计的原因在于需要考虑对照组的有效性,如 果试验组的效果只有对照组效果的很小一部分,那么试验组就变得没有价值了。 
        因此在非劣教研究中,需要确定这个界限,一般选择临床认可的大差值作为非劣效性检验的界值,记为M2,M2=ƒ×M1(0<ƒ<1)。M2是临床可以接受的试验组较对照组疗效差的大界值,它 直该<M1,因为当M2>M1时,表示试验组将失去对照组的所有效果,也就是说,以对照组为参照试验组是完全无效的。ƒ越小,说明试验组的疗效越接近阳性对照组:但ƒ过小。可能导致样本世过大而无法实施试验。的意义就是要求试验组至少能保持对照组疗效的比咧。所以要衡量临床意义与样本量大小,选择一个合适的值,一般定在0.5~0. 8。 试验组与对照组的非劣效判断,可采用可信区间法;若上限<M2,可认为试验组与对照组 相比非劣效。见图4-3。 

        H0:C-T≥M2(试验组比对照组的差,且差距≥M2) H1:C-T<M2(试验组比对照组的差,差距 如果试验产品具有一些重要的优势(例如在安全性或次受指标方面).则临床认可的界值 可以比较宽橙。在非劣效界值判定过程中.多步骤和界值假定都是潜在不可靠因素,会对试验结果和结论造成影响。 
        从定义上讲,非劣教研究设计提供了两种比较:①试验药与阳性对心药的直接比较;②试验药与安慰剂组的间接对照。非劣效试验中阳性对照药估计的疗效是根据以往试验巾的疗效得出,如果以前有过对阳性对照药的疗效估计或者建立了循征医学证姑HFSDE( historicalevidence of sensitivity to drug effect-ICH E-10).考虑到历史试验研究与现行研究的差异,我们必须探讨这个疗效值在新的研究中是否依然适用,是作为恒定茵还足以某种方式进行调 整后才能用。我们必须确保非劣效试验的研究质艟,因为低质址的研究会降低对照药的疗效, 会对对照药的药效估计产生不良影响。

        (三)非劣效研究的样本量估计
        对于非劣效试验来说,样本量估计方法很重要。当试验药足真的非劣效时,使试验有把握 度来判断非劣效界值是否已经被减掉通常不是一项轻松的工作。在方案设计阶段,非劣敛界 值的大小已经被界定好;样本量的大小必须满足疗效差<M:的要求。被减去的界值魁样本量 估计中一个重要的环节,但是我们无法知道治疗效果估计的变异度。有时候在新的研究中事件发生书啊可能会降低,假如非劣效界值(C-T的95%置信区间上限)为增加的风险不大r25%,那么当阳性对照组的事件发生率由4%上升为8%时这个要求将变得更加容易达到,而 且在这两种情况下阳一陀对照组都是20%优效于安慰剂组。这样的问题在优效性试验的样本堪计算时同样存在。 
        临床试验中所需的样本量应足够大,以确保对所提出的问题给予一个可靠的回答。样本 量的大小通常根据试验的主要指标来确定。一般只有一个主要疗效指标。l类错误概率常用 单侧0.025,Ⅱ类错误概率应不大于0.2。 率差非劣效样本量计算公式: nc (6.1)其中T为试验组率的估算值、C为阳性对照组率的估算值,δ=C-T≥0,△>0为非劣效界值,K为分组比例, nc。为对照组样本量,knc为试验组样本的样本量。 率比非劣效样本量汁算公式: nc= (6.2)其中δ=In(C/T)≥0,T为试验组率的估算值、C为阳性对照组率的估算值,K为分组 比例均数之差非劣效样本量计算公式: nc= (6.3)其中,为δ2合并方差的估算值,δ= C-T≥0,T为试验组均数的估算值、C为阳性别照组均 双的估算值,△>0为非劣效界值,K为分组比例 低优指标时(6 .1)(6. 3)δ=C-T≥0;(6 .3)式中δ= In( T- C)≥0
        (四)非劣效研究中的潜在偏倚

        通常临床上随机优效性试验的结果分析要满足意向陛治疗(ITT)的原则,就是说,所有的连机化病人都是根据随机结果来进行相应的治疗。这样分析的目的是避免引起像病人转换治 疗方式,选择性偏倚,和脱落/撤回等对观察治疗效果造成影响的偏倚。通常这被认为足保守 约策略。在优效性试验中我们也会偏向于进行意向性治疗分析来防止各式各样的偏倚。在非 再效试验中,许多对优效性试验致命的问题,比如不依从性,主要终点指标的错误分类,或者是型常见的度量问题(像噪声的度量),或者是在试验组中大量病例的脱落会使结果不断偏倚直置没有差异,而这个“相对的没有差异”正是非劣效试验想要的结果。这种情况下,试验的正确性将受到质疑,可能会将实际上不存在的非劣效结果当成非劣效。这一点会对试验结果造成很大的影响,所以务必要注意,非劣效试验对试验质量有比较高的要求。虽然在非劣效研究中, “被当成试验组”分析经常是主要的分析方法,也有需要信息审查的可能眭。因此,对于非劣教 研究来说,意向性治疗和“被当成试验组”分析都很重要。这两种分析方法的差异有待进一步 硅验。好的建议是,在进行非劣效研究过程时,在试验的设计阶段注意这些潜在的问题并通过监察来把这些问题小化,因为它们会严重影响非劣效研究的正确性。 
        其他任何发生于研究中的偏倚也要在非劣效研究中予以考虑,尤其是在不设盲的研究中怎 样好地确保终点指标的无偏估计,无偏地纳入患者,以及其他各类潜在偏倚都应该特别注意。

        (五)非劣效研究中的非劣效殛优效性检验

        一般来说,当只有一个终点指标和一个试验组时,非劣效设计可以用来检验优效性,且不必校正I类错误,也就是说,检验非劣效性时通过预定的界值得出的95%或者更高的置信区 间的值,可以用来检验优效性。我们也可吼把它当成是一种两步分析法在非劣效过程中采用 95%置信区间(如果试验药确实是优效的那么总是会成功)分析,然后再接着做优效性检验。 这种连续的检验在非劣效和优效试验中的一类错误率都控制在5%以下。与此相反,在一个 失败的优效性研究之后进行个非劣效的研究,通常会得到一个错误的结果,这样的研究通常也会被认为是一个失败的研究。因此,成功的非劣教研究允许再进行优效性研究。一个失败 的优效性研究是不允许再进行非劣效研究的。 
        当非劣效试验有多个终点或者多个试验组时,有效的统计央策将变得非常复杂。先不考 虑是非劣效检验还是优效性检验,如果在每个终点水平或者每一组都采用相同的95%置信区 间来检验非劣效和优效性,就会使总的一类错误增加,导致在多重比较分析中得出一个或多个错误的结诒。因此,对所有在检验中涉投的比较时所犯总体一类错误的估计“段对其做出适 当的统计学调整就变得至关重要。 非劣效没计中的有些结果的解释要比优效性检验中的更为灵恬,尤其像设计和执行上的问题比如说依从性问题,或者错误分类/测量醴差等那些会严重影响优效性研究的问题,显然 可以考虑采用非劣效设计。

        【例4-2】对于随机对照部分,根据一个注册研究结果显示,某药物洗脱支架平均置人9个月时,支架内晚期管腔丢失(late loss)为(0.21±0.39)mm;另一项注册研究报道了对112处靶病变平均24-1d造影随}方结果,显示该支架的支架内晚期管腔丢失为(0 12±0.34)mm;此外一项人选超过500例病人的平行对照研究显示,该支架的支架内晚期管腔丢失为(0. 18±0. 07)mm;综合以上研究报道,将本研究中对照组支架的管腔丢失估计为(0. 21±0 35) mm, 临床认可的非劣效界值为0 .12rnm;当统计学显著性水平取(双侧)5%,把握度80%时,每组的 n= =134.4 ≈ 135,[Z0.05+Z0.2]2 =7.9考虑30%的脱落率后n=135/0. 7 =192. 9 ≈193,两组样本量N=193×2=386例,