微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 行业资讯 > 生存分析----Cox回归模型

生存分析----Cox回归模型

文章来源:www.3618med.com发布日期:2013-06-24浏览次数:29277

        目前对生存资料的多因素分析常用的方法是Cox比例风险回归模型(proportional hazards regression model),简称Cox模型。该模型是一种多因索的生存分析方法,它可同时分析众多因素对生存期的影响,分析带截尾生存时间的资料,且不要求估计资料的生存分布类型。 
        由于上述优良性质,该模型向英国统计学家D.R.Cox于1972年提出以来,在医学随访研究中得到非常广泛的应用。


        其中,D为死亡(终点事件)发生的个体,Z为个体各个变量实际取值,Ri为观测时间不小 于f,的个体的集合 
        似然方程组为:

        所得之解即为极大似然估计,在建立Cox回归方程时,风险比例可能会随时间变化而变化,即有些危险因素作用的强 度随时间而变化,这样的资料是不适合前面所讲的一般的Cox同归模型的。对Cox模型的简单形式的直接扩展是引入时间相依协变量( time-dependent covariates)。此时的模型变为:

        回归系数的检验方法有3种。①Score检验:常用于模型中新变量的引入;②Wald检验:
常用于模型中不重要变量的剔除;③似然比检验:常用于模型中不重要变量的剔除和新变量的 引人。以上3种检验方法均为x2检验,自由度为模型中待检验的参数个数。

        【例17-4】某研究欲考察某类型心脏病患者置人起搏器的预后生存时间和结局情况,以及两种起搏器是否存在差别,统计接受治疗的60例患者预后生存情况,x1:起搏器种类(0:A类;1:B类),x2;年龄,x3:bmi,x4:糖尿病史(0;无,1:有),x5:高血压史(0;无,1:有)。t:生存时间(月);status.生存结局,死亡=l,截尾=0。数据如表17- 3所示。



 

        研究者欲分析影响心脏病患者生存时间长短的因素,包括置入起搏器的种类、年龄、bmi指数、糖尿病止、高血压史.并根据影响因素进行不同R十间点上生存率的预测。 Cox模型届比例风险模型簇,其基本假定之一是比例风险假定。只有满足该假定前提下,基于此模型的分析预测才是可靠有效的。检查某协变赶是否满足PH假定,简单的方法是 观察按该变量分组的Kaplan-Meier生存曲线,若生存曲线交叉,提示不满足PH假定。第二. 种方法是绘制按该变量分组的In[− InS(t)]对生存时间t的图,曲线应大致平行或等距。如各协变量均满足或近似满足PH假定,可直接应用基本Cox模型。 表17 -3数据中,年龄为连续性变量,将年龄转化为两分类变世(<80岁,即低龄老年人 和≥80岁,高龄组),bmi指数分为(<=25和>25)、使用起搏器种类、糖尿病史、高血压病史 个变量的生存曲线见图17-4。

        图中X1,X1−1两个变量绘制生存曲线是交叉的,其余3个变世满足PH假定,本例中仍假定数据满足PH假定,使用COX回归分析模型。 程序名为CTl7-4: PHRE(;过程是实现Cox模型的标准过程,其中MODEL语句是必需语句。MODEL语 句左边为生存时间和生存结局变量(括号内为截尾值),右边为协变量。该语句比较重要的选 项有:

        (1) TIES= DISCRETE | EXACT | BRESLOW | EFRON,指定重台生存时间或称结点 ( ties)的处理方法。DISCRETE和EXACT为精确法,DISCRETE法假定事件确实发生在相 同的时间,而EXACT法假定结点来自连续的无结点资料。BRESLOW法(1974,缺省值)和 EFRON法(1977)是精确法的近似。关于四种方法的选择,没有结点时,

        4.种方法结果相同;结 点比例不是很大时,4种方法结果相近;结点比例很大时,两种近似结果有偏性,考虑计算耗 时,可选EFRON近似法。 (2)SELECTION= FORWARD | BACKWARD | STEPWISE | NONE | SCORE,指定变
量筛选方法,分别表示前进法、后退法、逐步法、全回归模型(缺省值)和优子集法。

        (3) SLE=和SLS=分别指定引入和剔除变量的显著性水平α。缺省值为α=0. 05。 (4)RL要求输出风险比HR的95%置信区间。 OUTPUT语句创建一个新的SAS数据集,含有为每一个观测计算的一些统计量,SAS为每一个统计量定义一个关键字,如生存率和预后指数分别用SURVIVAL和XBETA表示。 选项ORDER=DATA规定输出的数据集中的观测顺序与输人数据集中的顺序一致.METH-OD=PLICH EMP规定用于计算生存率的方法,PL表示生存率的乘积限法(缺省值),CH和 EMP表示生存率的经验累积风险函数估计法。

        PHREG过程的其他语句有:①STRATA语句用于建立分层Cox模型。格式为,STRATA分层变量。注意分层变量不宜太多,否则每层观察单位数太少,会影响分析结果。 ②ba[x]seLINE语句用于输出对原有数据集以外某新数据集中观测的生存预测。格式为, ba[x]seLINE OUT-输出数据集名COVARIATES-新数据集名,关键字=变量名/选项。新数据集中的变量必须与后Cox模型中的变量相对应。常用关键字有SURVIVAL(生存率) 和XBETA(预后指数)等。该语句中“/”后的选项有METHOD=PLI | CH | EMP,意义同OUTPUT语句。 
        主要分析结果及解释:

        逐步法步、第二步和第三步分别引入变量x2,x4和,x5,SAS输出每一步的模型拟合统计量( −2LOGL,AIC和SBC)及模型检验结果(似然比检验、Score检验和Wald检验).之后是模喇的大似然估计,包括参数估计(parameter estimate)、估计值标准误(standard Error)、Waldχ2-(chi-Square)、P值(Pr >ChiSq)、风险比HR及HR95%置信区问(hazard ratioconfidence limits).
        Cox模型结果显示:年龄、糖尿病史、高血压病史均为置人起搏器的心脏病心析发生死 亡的危险因求。3个变量的回归系数均为正值,提示年龄>80岁、有糖球病史和高血压病史的患者死亡的概率增高。糖尿病史,高血压病史不变的情形下,年龄每增加1岁,死亡风 险增加0.147倍;年龄与高血压病史不改变情形下,有糖屎病史的患者死亡风险足无糖尿 病史患者死亡风险的4.806倍;年龄与年龄病史不改变情形下,有高血压病史的患者死亡 风险是无高血压病史患者死亡风险的8.85倍,增加了7.85倍。由Cox回归分析结果,得出风险函数的表迭式为: