从ICH E9R1中我们了解到,估计目标、伴发事件和伴发事件的五种策略(疗法策略、假想策略、复合变量策略、在治策略和主层策略)。简单理解,好像是之前对缺失值的处理有了一个系统规范的框架来明确这些事情,让问题更清晰。然而,我们也会思考,选择这几种策略的原因,以及这几种策略的来源,带着这个问题,笔者整理了几篇文献,做了一些笔记,希望能简单地讨论一下这个问题。
因果推断和估计目标之间的联系
估计目标的框架来自于因果推断(Causal Inference),什么是因果关系(Causality)呢?在药物临床试验里,为了简单理解,我们可以把因果关系理解为患者使用的研究药物是否会治疗好相应的疾病,比如吃了减重药是否可以使体重下降,即减重药用药和体重下降是否存在因果关系。
那么,需要如何设计和完成一个试验,才能够证明这种因果关系呢?首选的设计通常是随机双盲对照试验,方案明确规定了给药方法,而且所有受试者都遵照方案接受了治疗,并且完成了所有随访,这是一种理想的情况。
但是,毕竟会发生各种各样的情况,比如受试者接受了挽救治疗、受试者终止研究、受试者失访等等。如果发生了这些情况,我们还可以继续分析,根据分析结果,做出减重药用药和体重下降之间有因果性的判断吗?
直观感觉是有可能的,因为绝大多数临床试验都不是理想的临床试验,但是否有理论依据呢?可不可以依靠一种理论框架来规范、来有据可循?答案也是有的,这就是因果推断。
假设某位患者是否服用药物(用z=0或1表示)对应两种结局(Outcome,Y(z)),我们假设未服用的结局是Y(0),服用的结局是Y(1),也可以把这两种结局叫做Potential Outcomes(潜在结局,POs)。
这里会存在一个问题,就像黄色的树林里分出两条路,可惜不能同时去涉足,同样,患者服药与否只存在一种情况。对一个受试者服用了药物,那么Y(1)就是我们观察到的结果,Y(0)是实际没有出现的结果,我们也称Y(0)是反事实(counterfactual)结果。如果受试者未服用药物,Y(0)是观察到的结果,Y(1)就是反事实结果。如果能得到所有受试者的Y(0)和所有受试者的Y(1),就可以进行因果关系的判断,但实际上是不可能的,我们一般是用描述用药和不用药人群之间的差异(Difference, Risk ratio或Odds ratio)的关联(Association)来代替因果关系(Causation),如下图所示(图中A表示治疗,和上文中Z含义一样,只是换了一个符号)。
*引自:Daniel S. Estimands and Causal Inference. 2017.
一般我们有个一致性假设(Consistency Assumption),以图中所示为例,即P(Y(1)=1)=P(Y=1|A=1)和P(Y(0)=1)=P(Y=1|A=0)。如果这个假设不成立,可能是存在混杂因素等原因。P(Y(1)=1)表示如果每个人都接受了治疗(a=1),在人群中出现体重下降(Y(a)=1)的受试者比例(P)。P(Y=1|A=1)表示在接受治疗的人群中(a=1),出现体重下降(Y(z)=1)的受试者比例(P)。我们可以看出P(Y(1)=1)和P(Y=1|A=1)的不同,前者的人群是全人群,后者的人群是接受治疗的人群。
下面我们来看一下伴发事件的影响,如果我们说Z是治疗,治疗之后会产生结局(S),对结局S会发生影响治疗的干预(R),最后影响最终结局,也就是我们上文提到的Y。
S和R是我们通常所说的伴发事件,不同的是在因果推断中,把结局S和干预R区分开了。例如一个受试者因严重不良事件而退出研究,严重不良事件可以认为是S,退出研究可以认为是R。这样分开的好处是,可以理解成一个事件或者因为一个事件而引起的干预,都可能导致对Y产生影响,统称叫伴发事件。图中的X为基线协变量。
*引自:Lipkovich, I. Causal Inference and Estimands in Clinical Trials. Statistics in Biopharmaceutical Research. 2020.
因为发现S和R也会对Y产生影响,我们也可以扩充Y(z)为Y(z, s/r),以这种模式讨论不同的伴发事件策略,下面以二分类变量的有效率(P)为例,讨论疗法策略、复合策略和假想策略。
1. 疗法策略
疗法策略下伴发事件的发生与定义治疗效应无关,即无论是否发生伴发事件,均会使用相关变量的值。在疗法策略里,我们认为s/r是没有影响的,关注的是
P(Y(1)=1) vs. P(Y(0)=1)
2. 复合策略
复合变量策略与关注的变量有关。伴发事件本身可提供关于患者结局的信息,因此将其纳入变量的定义之中。在复合策略里,我们认为s/r可以合并到Y中,可以理解成Z对Y与S/R合并的影响。比如我们新建了一个结局U(z)=0为治疗失败,Y为第12周是否治愈(治愈为1,未治愈为0),R为在第12周之前接受补救治疗(未接受补救治疗为1,接受补救治疗为0),当Y(z)=0或R(z)=0时,令U(z)=0。根据新建的结局,我们关注的是
P(U(1)=1) vs. P(U(0)=1)
3.假想策略
假想策略设想一种没有发生伴发事件的情景:此时,体现临床问题的变量值是在所假设的情景下采用的变量值。这里可以讨论两种情况,一种是我们假设伴发事件S/R与给定治疗和基线时的结局Y(z, s/r)|Z,X是独立的,此时关注
P(Y(1,1)=1)vs. P(Y(0,1)=1)
和P(Y(1,0)=1)vs. P(Y(0,0)=1)
另一种是我们假想了没有治疗时伴发事件的发生情况,我们关注
P(Y(1,R(0))=1) vs. P(Y(0,R(0))=1)
假想策略也可以有更多的探讨。根据E9R1内容,存在各种各样的假设情景,但其中有些情景更具临床或监管意义。例如,在与可实施试验条件不同的条件下的治疗效应可能具有临床或监管重要性。具体而言,当出于伦理原因必须提供额外药物治疗时,可能要考虑未提供额外药物情形下的治疗效应。
总结
综上,了解因果推断,可以有助于对估计目标的理解,更好地针对临床试验实际问题进行解释和处理。本文抛砖引玉,理解难免有不足之处,期待更多讨论。
参考文献
1. ICH. E9(R1):临床试验中的估计目标与敏感性分析(E9指导原则增补文件). 2019.
2. Lipkovich, I., Ratitch, B., & Mallinckrodt, C. H. (2020). Causal Inference and Estimands in Clinical Trials. Statistics in Biopharmaceutical Research, 12(1), 54–67. https://doi.org/10.1080/19466315.2019.1697739
3. Daniel S. Estimands and Causal Inference. 2017-11-2.
4. Robert F. The Road Not Taken. 1915.
5. 潘老师肿瘤临床设计,因果推断和估计目标值 - 第1节https://www.bilibili.com/video/BV1yy4y1M7ZR/?share_source=copy_web&vd_source=ec978f6dcc50fb48f67b28cf7d43d197