微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 行业资讯 > 医疗器械临床试验主要内容----研究终点和试验设计

医疗器械临床试验主要内容----研究终点和试验设计

文章来源:www.3618med.com发布日期:2013-06-14浏览次数:28786

        评价申请洼册器槭的有效性和安全性应设立应的临床试验现察指标(变量)。在有效性 评价设讣时一般应考虑两种变量:结果变量(或是终点)和影啊变量:结果变量给出了临床研 究目的中所提出问题的答案。并且应该对该设符声称的性能有直接影响。这些变量应该能够 直接观测,尽可能客观。有小的偏倚及误差,与接受设备干预病人的临床状况的生物效应有直接联系。 
        任何对于某种没备的临床研究应该有主要结果变量,有些时候存在次耍结果变量。主要 结果变量应该是能够提供直接与首要研究目的相关的,可信的变量。通甜仪有一个主要结果变量,该变量应该在试验方案中明确。在所有相同样本量的估计巾,这是恰当的变量。 然而有时使用更多的主要变量可以更好地牺盖设备效应的范围。次要结果坐世可能支持与主 要目的相关的测挝,电可能是与次要研究目的(如果存在)相关的测量。在试验方案中预先 对其进行定义也十分重要。影响变量(混淆因索)或预后因素指的是,研究过程中任何可能干扰终点或治疗与结果之间关系的方面。因此,在设计柴器械临床试验的过程中,应该小心地确定可能影响试验结果的影响因索。

        (一)研究终点
        观察指标是指能反映临床试验中器械疗效和安全肚的观察项目。统计学中带将观察指标 称为变量( variable)。观察指标必须在研究方案中有明确的定义和可靠的依据,不允许随意修改。观察指标分为测量指标和分类指标。

        1.主要终点(primary endpoint)叉叫主要指标,是能够为临床研究主要目的提供可靠 证据的指标。主要终点常常是估计样本量及得到终临床结论的依据。主要终点既可为疗效指标,也可为安全性评价指标。主要终点应为相关研究领域中已得到的准则或标准。可以采用前人在相关研究领域中已采用过的并已通过实践验证过的指标。应选择易于量化、客观性强的指标作为主要终点。在研究方案中需确定有明确的定义,并说明选择的理由。在临 床试验的疗效或安全陆评价时,应以主要终点为依据。并用于试验样本含量的估计。

        2.次要终点( secondary endpoint)又称为次要指标,是指为试验主要目的提供支持的附 加指标,也可以是与试验次要目的有关的指标,在研究方案中也需明确说明与定义。

        3.联合终点(composite endpoint)多个终点组合起来构成的终点称为联合终点,又称为 复合指标。临床上经常采用的量表( rating scale)就是一种联合终点。当组成联合终点的某些 独立终点具有临床意义时,也可以同时单独进行统计分析。

        (二)试验设计
        应特别强调的是,由某个研究者造成的背离研究方案将对试验的分析产生巨大的问题。 申办者应保证研究者遵从研究方案。有迹象表明,在试验过程中不愿遵从方案的研究者,不论何种原因都不能参与临床试验。

        l.平行组设计平行组设计也就是人们常|兑的头对头设计,即试验组和对照组同时开始、同时结束,是所有试验设计中简兽、也是常见的一种试验设计类型。平行组殴计中,各 组受试者在试验中处于相同的条件,的不同点是各组肝使用的器械不同,如有的是试验器 械,有的足剥雕器械,后根据试验结果作出统计分析。 
        通常根据试验方案的需要,可为试验组设置一个或多个对照组,试验器械也町按照若干种治疗强度殴组。对照器械的选择应符合试验方案的要求。对照组可分为阳性或阴性对照。 阳性对照一般采用按所选适应证的当前的有效器械,阴性对照一般采用疗效来被业界证实的安慰器械,但必须符合伦理学要求。

        2.交叉设计屉按事先设计好的试验次序,在各个时期对受试者逐一实施各种处理,以比较各处理组间的差异。交叉设计是将自身比较和组间比较设计思路综合应用的一种设计方法,可以很好地控制个体间的差异,同时减少受试者人数。 然师,实施交叉设计比实施平行设计更复杂,因此需要更密切的试验盟查。每个试验阶段 的治疗对后一阶段的延滞作用称为延滞效应。采用交叉设计时应避免延滞效应.即在每个试 验阶段后需安排足够长的洗脱期或有效的洗脱手段,以消除阶段试验所产生的延滞效应。 
        简单的交叉设计是2×2形式,对每个受试者安排两个试验阶段,分别接受两种器械治 疗,而每一受试者在第阶段接受何种器械是随机确定的,第二阶段必须接受与阶段不同的另一种试验用器械。因此,列于2×2变叉设计,每个受试者均需经历如下几个试验过程, 即:准备阶段、试验阶段、洗脱期和第二试验阶段。在两个试验阶段分别观察两种试验用 器械的疗效和安全眭。 
        交叉设计的统计分析同样比平行设计更复杂,因为病人对任何试验阶段的疗效通常与对另一试验阶段的疗效相关联,因为同一个病人应用了不止一个试验阶段的治疗。因此,统计分 析时需检验是否有延滞效应存在。 交叉设计常用于比较同一器械的两种或多种不同治疗强度的临床疗效。交叉设计应尽量避免受试者的失|方。

        3.析因设计呵应用于医疗器械临床试验的第3种设计是析因设计。当一个医疗器械 与一个治疗(如药物治疗)干H比较时.经常使用这种方法。这种研究设计可回答如下问题是否器械独自起作用?或是否器械与药物治疗相互影响,联合产生更强的作用? 
        本设计的不足之处是实施起来更复杂,因此申办者必须保证研究者严格按照研究方案实施临床试验。 析因设计也许需要更大的样奉量但足由于这种设汁类型基本上是两个临床试验合并成一个,因此效率更高。但是.如果试验的样本量是基于检验主效应计算的,则估计器械与药物的交互作用时会使检验效能降低。 还有一些其他的试验设计,如成组序贯设计、适应性设计等,使得评价起来更复杂。总之, 所选择的设计应与申办者的目的相适应。研究目的也许导致复杂的研究,因此需要仔细地对 研究进行设计、监查和评价。有时,可m通过限制试验范围的方法,来设计不太复杂的试验。 但是应该认真地考虑能否这样做,因为这将导致对器械应用范围的限制。

        4.目标值法的单组设计剥于某些器械,如果存在本研究领域临床认可的、国内/国外公 认的疗效/安全性评价标准(如FDA/SFDA指导原则、ISO标准、国标或部标等规范或指南),其中明确指出了凌器械的主要疗效/安全陡评价指标及其评价标准,那么可以以此评价标准为 目标值计算临床试验样本蛙,并进行符合该目标值的单组试验。试验结果的评价,同样应采用主要疗效评价指标的95%可信区间。这种与目标值进行比较的单组试验,称作OPC(optimalperformance criteria)研究。

         (三)医疗器械临床试验比较类型
        临床试验中比较的类型,按统计学中的假设检验可分为优效性检验、等效性检验和非劣效 性榆验。选择何种比较类型,应从临床实践角度出发考虑,并在制定研究方案时确定下来。

        1.优效性检验优效性检验的目的是显示试验器械的治疗效果优于对照器械,其零假设 为H0:πT-πc≤△,备择假设为πT-πc>△。对照器械既可以是无任何疗效的安慰器械、也可以是疗效确证的阳性对照器械。采用何种器械作对照,应按照临床需要、并符合伦理学原则 科学地设计。优效性检验的评价方法,类似于传统的假设检验。

        2.非劣效和等效性检验出于伦理学或者可操作性考虑,有时采用安慰器械作为对照器械往往在临床实践中不具有可行陛。因此,在临床试验设计时,往往更多的采用疗效确实的阳 性器械作为对照,即与已经被批准上市的、具有确切临床效果的同类器械进行对比,此时希望 通过试验验证的结论为:试验器械的疗效与阳性对照器械实质等同,其假设检验为非劣效检验。即试验器械的疗效可以稍劣于对照器械,但此差距不能超过临床认可的非劣效界值。评价非劣效试验的结果时,传统假设检验的P值没有意义,应采用疗效差值的95%可信区间进 行评价。 
        等效性检验与非务效检验类似,也是与已经被批准上市的、具有确切临床效果的同类器械进行对比。只是结果判断时,疗效差值的95%可信区间必须落在临床事先给定的等效性界值 区间之内。 非劣效界值和等效性界值均需在方案设计阶段由临床医生确定,且用于样本量计算。 等效性检验的目的是确认两种或多种器械的效果差别大小在临床上并无重要意义,即试验器械与对照器械在疗效上相当。而非劣效性检验目的是显示试验器械的治疗效果在临床上 不劣于对照器械。在显示以上两种目的的试验设计中,对照器械的选择要非常慎重。所选择的对照器械应是已在临床广泛应用的、对相应适应证的疗效/安全性已被证实,使用它可以有把握地期望在对照试验中表现出相似的效果。理想情况下,对照组有曾与安慰器械对照的临 床试验证据。 进行等效性检验或非劣效性检验时,需预先确定一个等效界值(上限和下限)或非劣效界 值(下限),这个界值不应超过临床上能接受的大差别范围。等效界值或非劣效界值的确定需要由主要研究者(临床专家)从临床角度决定,但同时应满足统计学要求。

        (四)样本含量

        临床试验的目的是在目标人群的样本中收集有关医疗器械安全性和有效性的数据。然后 用统计分析将结论推断到与试验人群具有相同特征的目标人群。而只有将研究问题翻译成具有人群特征的数学关系表达式,才能进行统计推断。我们称这个数学关系表达式为假设。对该假殴所做的检验应该为该研究问题提供明确的答案。每个临床试验的样本量应符合统计学 要求。 
        例如,如果研究问题是“对于某个疾病A,用试验器械治疗后,试验器械组主要后果的均值 大于对照组的均值吗”?该问题产生两个假设。一个零假设:治疗组病人治疗后的均值等于 (或差于)对照组的均值;另一个是备择(或研究)假设:治疗组病人治疗后的均值大于对照组的 均值。当将从样本得出的结论推断到总体时,可能会犯两类决策错误。如果样本显示器械治疗组的均值大于对照组的均值(即拒绝无效假设),而人群中没有发现两组均值有差异时,就犯了l类错误(也叫a错误)。另一方面,如果样本显示两组均值间无差异(即接曼无效假设),而 实际中,器械治疗组均值确实大干对照组时,就犯了Ⅱ类错误。犯Ⅱ类错误的概率也被称为p错误,统计效能就被定义为i-B。 
        在用于假设检验的样本量计算中均要用到上述两个错误概率,同时还应包含临床有意义的差值,即由临床专家确定的具有临床显著意义的结果变量间的差别。常用的样本量计算公式包含处于分子位置的临床有意义差值的变异度的估计,和处于分母位置的临床有意义差 值的估计。因此,对于一个已知的后果变量,变异度越大,所需要的样本量也就越大。类似地, 当变异度巳知时,要检测的临床差异越小,所需要的样本量就越大。 
        总而言之,样本的大小通常按照具体受试产品的特性、主要评价指标及其参数来确定。其具体计算方法以及计算过程中所需用到的统计量的估计值及其依据应在临床试验研究方案中给出,同时需要提供这些估计值的来源依据。在确证性试验中,样本垃的确定主要依据已发表的文献资料或预试验的结果来估算。Ⅰ类错误常用5%.Ⅱ类错误应不>20%(检验效能不应 低于80%)。