❶ 生存分析之Cox回归
生存分析的核心是研究个体的生存状态和时间,特别是在医学领域,尤其关注病人生存与死亡的数据。Cox回归则是其中一种常用工具,它探究影响患者死亡速率的因素,区分单因素或多因素分析。Cox回归模型基于风险函数h(t),表示在特定因素影响下,患者在某一时间点死亡的概率。其公式以协变量(如年龄、性别、疾病状态等)和回归系数的形式呈现,通过极大似然法估计这些系数。
删失现象在生存分析中常见,即患者在观察期内未被观察到死亡,这种情况会影响数据的完整。lifelines库是学习Cox回归的实用工具,通过DataFrame输入生存时间和生存状态等信息,进行模型拟合。模型评估通过HR值(风险比例)、95%CI(置信区间)和p值进行,HR>1表示风险增加,反之风险降低。c-index则是模型预测准确性的度量,反映模型在预测生存时间方面的性能,c-index值越高,模型预测越准确。
K-M曲线,即生存曲线,直观展示随时间推移的生存率变化,是分析结果的重要可视化手段。删失数据会在曲线中通过特定标记显示。通过对比不同组别的K-M曲线,可以直观判断生存率差异,例如性别2的生存率相对较高,性别1较低。
深入学习Cox回归和相关概念,可以参考以下资源:360doc.com/content/20/0... 和 zhuanlan.hu.com/p/14...
❷ 生存分析的数据类型(左删失、右删失...),你都了解吗
生存分析在长期纵向观察的随访研究中发挥着重要作用。它不仅关注终点事件的发生与否,还考虑了事件出现的时间,从而有效处理了时间因素的影响。生存分析的数据资料通常分为终点事件和删失两类。
完全数据是指在研究过程中能明确记录每个对象的生存时间或事件发生的具体时间。其中,生存时间是从起始事件到特定终点事件之间的时间跨度。然而,在实际研究中,数据完全观察到的情况并不多,因此经常出现删失数据。
删失数据发生在无法明确观察到终点事件的具体时间,或者研究对象因搬迁、失联、中途退出研究或死于非研究事件等情况,导致事件发生时间未知。在生存分析中,事件发生记为“1”,删失记为“0”。
产生删失的原因多样,包括研究截止时终点事件未发生,研究对象失去联系,中途退出研究,或死于非研究相关事件等。根据情况,删失数据分为右删失、左删失和区间删失三种类型。
右删失发生在研究结束前,终点事件尚未发生,未知确切时间,但肯定大于观察时间。右删失又分为I型删失(所有对象观察起点统一,固定删失时间)、II型删失(观察到足够数量的事件后停止,删失比例事先设定)和III型删失(观察起始和删失时间不一致,随机发生)。
左删失发生在研究开始时事件已发生,但无法确定具体时间。区间删失则是在研究中只能获知两次随访间是否发生事件,但无法确定准确时间,只有事件发生在两次随访间的区间内。
理解这些数据类型对于正确应用生存分析至关重要。在实际研究中,不同类型的删失数据需采用相应的分析方法进行处理,以获得准确的结论。