- 我不懂运营
-
生存分析(Survival Analysis)是对一个或多个非负随机变量进行统计推断,研究生存现象和响应时间数据及其统计规律的一门学科。」
生存曲线可绘制试验结果,试验结果是死亡(或其他一次性事件)前的时间。GraphPad Prism 可使用 Kaplan - Meier 法根据原始数据创建生存曲线,并可对生存曲线作出比较。
01 生存分析中的关键概念 ——「生存曲线」
在许多临床和动物研究中,结果是生存时间。研究目的是测定治疗是否会改变生存率。GraphPad Prism 使用「Kaplan—Meier 法」(即乘积极限法)创建生存曲线,并使用对数秩检验和 Gehan - Wilcoxon 检验比较生存曲线。
1. 删失数据(Censored data)
创建生存曲线其实比想象中要困难。这个困难在于很难清楚地了解各受试者的生存时间。比如,
a. 在研究结束时,一部分受试者可能并没有死亡。 你知道到目前为止他们的寿命,但是不清楚会到什么时间结束;
b. 有部分受试者中途退出了该项研究。如搬到另座城市、或想要服用现有方案禁止的药物。 这种情况下,你了解这些受试者其实在你的研究中存活了一段特定的时间,但不了解在此之后他们的寿命会到什么时间结束(即使了解也无法使用这些信息。因为他们未遵循既定的实验方案)。
在以上两种情况下,这些受试者的信息均视为「删失(Censored)」。通常我们不希望直接从分析中删除这些「删失」的观察结果,但需要正确地解释这些数据。我们需要正确的理解「删失(Censored)」的含义,它意味着「不清楚」,或「无法使用超出特定点的生存时间」。Prism 在创建和比较生存曲线时,会自动考虑「删失数据」。
2. 不仅仅是针对「生存(Survival)」
「生存曲线(Survival Curve)」一词会有点限制性,因为结果可以是任何定义明确的「终点」,每个受试者只能发生一次。除死亡外,终点也可以是血管移植物的闭塞、肿瘤的首次转移或移植肾的排斥。也并非都是可怕的类型,也会包含如肾功能恢复、出院或毕业等。
3. 分析其他类型的生存数据
使用非线性回归可以更好地分析其他类型的生存数据。 举个例子,本篇中描述的方法不适合分析细胞存活曲线,该曲线绘制的存活百分比(Y)是各种剂量辐射(X)的函数。 注意:本篇描述的生存分析方法仅在 X 为时间时有用,且需要知道每名受试者的生存时间。
4. 比例风险(Cox)回归
Prism 内置的分析可以比较两组或更多组的生存曲线。 但这些方法(对数秩检验,Gehan-Breslow-Wilcoxon 检验)无法处理匹配组中受试者的数据,或还希望调整年龄、性别或其他变量的情况。 对于此类分析,需要使用比例风险回归,而 Prism 不采用该程序。
02 GraphPad Prism 有哪些帮助进行生存分析的方法?
Step 1. 创建「生存」图表
从「欢迎 (Welcome) 或新建表格 (New Table)」对话框中,选择「生存 (Survival)」选项卡。如果你还没有准备好输入自己的数据,可以使用样本数据,并选择其中一个样本数据集。
Step 2. 输入「生存时间 (survival times)」
按照下列要求,在表格中输入每个受试者:
a. 在 X 列中输入受试者「删失」或死亡(或正在跟踪的任何事件)的时间。可以使用任何方便的单位,如几天或几个月。 时间零点不必是某个指定的日历时间,而是定义为每个受试者进入研究的日期。所以不同的受试者会有不同的日历时间。 在一些临床研究中,时间零点跨度数个日历年。持续时间必须以数字的形式输入,并且不能直接输入日期。(或者输入行标题以标识每个受试者);
b. 在 Y 列中输入「1」,表示在 X 列中显示受试者死亡(或事件发生)时间的行。在当时删失受试者的 行 中输入「0」。生存研究中的每个受试者要么死亡,要么删失;
c. 将每个治疗组的受试者输入到不同的 Y 列。 将第一组受试者的 X 值录入到表格顶部,Y 代码放在第一个 Y 列中。 将第二组受试者的 X 值放在第一组受试者的 X 值下面(不必对 X 值进行排序,并且 X 列可能包含多个相同的值)。 将相应的 Y 代码放在第二个 Y 列中,将第一列留空。 在下面的示例中,在前 14 行中输入了 A 组的数据,在第 15 行中输入了 B 组的数据;
d. 如果治疗组是有固有顺序的(可能增加剂量),你在输入数据时保持这个顺序。确保从 A 列至 B 列至 C 列的进程符合治疗组的自然顺序。如果治疗组没有自然顺序, 那么你如何安排都可以;
e. 仔细检查在一列中输入数据的行数是否与该治疗组的人数/动物/人数相匹配;
在输入生存研究的数据时会比较麻烦。可以去 GraphPad 的用户指南上查看一些常见问题的解答、临床研究和动物研究的实际案例分享。
Step 3. 查看图表和结果
在输入完数据后,转到新图表查看完整的生存曲线。转到自动创建的结果表查看对数秩检验的结果,该结果可以比较多个曲线(如果输入了多个数据集)。
注意,Prism 对于生存分析的工作原理与其他分析方法不同。在选择生存图表时,Prism 会自动分析个人数据,无需点击「分析(Analyze)」按钮。
03 关于「生存分析」Q&A
Q1:我应该如何输入在研究结束时仍存活的受试者的数据?
A1:已知信息是目前为止这些受试者存活了多长时间,但是不了解之后的情况。x 是跟踪这些受试者的天数(或月数…)。Y 代表「删失「观测值的代码,通常为零。
Q2:如果有多名(>1)受试者同时死亡,应该怎么办?
A1:每名受试者分别录入不同的行,输入相同 X 值。
Q3:我如何输入因无关原因死亡的受试者的数据?
A3:不同研究者对此类情况的处理方式不同。有些研究者不区分死因,均视为」死亡「。而有些研究者将由无关原因导致的死亡视为」删失「。建议在研究设计中就做好决定。如果研究设计模棱两可,必须揭盲之前决定如何处理这些数据。
Q4:必须按顺序输入 X 值吗?
A4:不用。按你想要的顺序输入即可。重要的是每个 Y 值(代码)与适当 X 值位于同一行。
Q5:Prism 如何区分在研究结束时仍存活的受试者与退出研究的受试者?
A5:不作区分。在这两种情况下,观察结果经过「删失」。你知道受试者仍活着,且遵守方案已有一段时间。在这之后,你不清楚(患者仍存活),或者无法使用(患者停止遵循方案)信息。生存分析计算以同样方式对待所有经过删失的受试者。删失前,经过删失的受试者有助于计算生存百分比。删失后,这些受试者基本上都缺失数据。
Q6:我已获得显示不同时间的生存百分比的生命表(Life-table)。我能否将该表输入 Prism 中?
A6:不能。只有在你输入每名受试者的生存时间时,Prism 才可以分析生存数据。Prism 无法分析作为生命表(life-table)输入的数据。
Q7:我是否可以输入开始和结束日期,而非持续时间?
A7:可以。当你创建新的生存表时,可以选择输入开始和结束日期,而非天数。
Q8:我如何处理「已入组」但从未接受治疗的受试者的数据?
A8:大多数临床研究遵循「治疗意向」规则。你在假设受试者已接受其分配接受的治疗的情况下分析数据,即使从未给予治疗。当然,该决定应作为实验设计的一部分。
Q9:如果受试者刚好在招募后死亡,我是否应该输入 X = 0 的受试者?
A9:否。所有受试者的时间必须超过零。如果你输入 X = 0,Prism 会忽略该行。 有关 X = 0 的生存曲线的更多信息。
关于生存分析,你了解了吗?