EN
【技术】天地尚无完体 – 浅谈缺失值填补的那点事
2024-02-21 09:26

西游记第九十九回中,说到唐僧一行人取经归来,路过通天河,河中老鼋(yuán)本自愿驼他们过河,不料半途中,得知他们没有完成答应自己的事(向佛祖问寿数),老鼋一怒之下,将众人扔到水里。众人虽凭借法术安全上岸,但取回来的经卷都已湿透,只能放在石头上晾晒。收拾经卷的时候,有些书页粘在石头上取不下来,把经卷也撕破了。众人懊恼不已,孙悟空却说,天地本就不全,经文残缺,也是冥冥中应合了这个道理,非人力所能左右。

这个故事虽然扯得有点远,但如我们所知,无论是人生,还是临床试验,都不可能是完美无缺的。应对这些不完美,本就是我们工作和生活的一部分。而对于统计师而言,处理试验数据中的缺失值,是一项重要的工作。

假设在一个治疗高血压的试验中,我们一共随机化了100例受试者,但由于各种原因,其中20例受试者提前离开了试验,到了主要终点的观测时间点(比如第4周),仅剩80例受试者。那么,我们是不是可以仅将这80例受试者的数据用于分析,而忽略另外20例受试者呢?

简而言之,是不行的,至少是不够严谨的。为什么呢?请看下面这个小例子。

听说有这样一种骗局,有人号称自己能够预测股票的走势,而股票的走势,无非涨跌两种。第一天,他给1000人发信息,预测明天某某股票必涨;同时给另外1000人发信息,预测明天同一支股票会跌。第二天,等结果出来以后,只给猜对的那1000人继续发信息,同样的,也是跟其中的一半人说下一天这支股票要涨,跟另一半人说下一天这支股票要跌。然后第三天,第四天……重复这个操作,永远都只给猜对的那一半人继续发信息。这样反复几轮之后,虽然只剩下了很少的人,但是这部分人对这位“大神”的预测能力深信不疑,奉若神明,为下一步行骗打下了坚实的基础。而这位“大神”本身,当然是没有任何预测股票的能力的。

在临床试验中,也与上面这个例子相似,存在着“幸存者偏差”的问题(尽管不是人为刻意造成的),即效果好、副作用轻的人更倾向于留在试验中。如果疾病本身不是很严重,受试者人数又足够多,那么即使药物本身没有效果,也很可能会有若干“幸运儿”在试验中坚持到最后,并展现出很好的“疗效”。

因此,如果只分析留下来的受试者的数据,而完全忽视提前退出的受试者,我们就很有可能会过于乐观地估计疗效。但是,提前退出的受试者是没有收集到主要终点的观测数据的,没有数据,我们又如何将他们纳入分析呢?这就是我们今天的话题—缺失值填补。

 01  缺失值填补
缺失值填补,简单来说就是,人为的地给我们没有观测到的变量赋予一个值,并将这个值用于分析。这样做,虽然听起来可能比较主观,不太科学,但实际上,这也是我们不得不采取的措施。

一般来讲,对于确证性试验,主要分析应基于ITT原则,即把所有随机化的受试者都纳入分析。在上面那个高血压试验的例子中,我们本该纳入100例受试者,但其中仅80例受试者有主要终点的数据(第4周血压相对基线的下降值),如果我们仅分析这80人的数据,那就相当于我们的分析人群不再是ITT,而变成了“完成试验的受试者”这个人群,不仅人数大大减少(从100例减少到80例),而且结果也可能趋于乐观,这是监管机构所不能接受的。因此,我们必须对那20例没有观测到第4周血压值的受试者,进行缺失值填补,而保证我们最终依然有100个值用于分析。

这20个受试者的终点指标并没有观测到,要对它们进行填补,必然是基于某些假设的。“保守”是缺失值填补中的一大原则,也就是说,我们的假设应该是保守的,基于这些假设做出的填补,有很大可能会低估试验组的疗效,而不太可能高估试验组的疗效。大家可以想象,试验中存在缺失值,本来是一件缺憾的事情。但监管机构可以容许我们由于缺失值的存在而稍有“损失”(即低估疗效),而不太愿意看到我们由于缺失值的存在反而“获益”(即高估疗效)。所以,“保守原则”是我们需要考虑的。

  02  缺失值填补常用统计方法
下面让我们来看一下缺失值填补的常用统计方法:

有一种过去很常用、现在逐渐被取代的填补方法,叫做LOCF (Last Observation Carried Forward),即末次观测值结转法。它的做法非常简单,对于提前退出的受试者,直接把实际观测到的最后一个值带下来,作为主要终点(一般是End of Treatment)的观测值。这种方法有时候是保守的,有时侯是不保守的,我们可以看下面的两个例子。

11.jpg

图1 LOCF保守的情况

还是考虑第4周时血压相对基线下降的情况。假设图中的4个受试者都来自试验组,其中受试者#1、#3、#4都完成了4周的治疗,只有受试者#2(蓝色线)在第2周时提前退出。从图1中可以看出,用药后血压相对于基线,确实有明显的下降趋势,且降幅越来越大。在这种情况下,LOCF是保守的,将受试者#2第2周时的血压值作为第4周的血压值纳入分析,很可能是会低估了试验组的疗效的。

22.jpg

图2 LOCF不保守的情况

而图2中的情况,就完全不是这么回事了。同样还是受试者#1、#3、#4都完成了4周的治疗,受试者#2在第2周时提前退出,但药物的疗效出现了变化。这一次血压的降幅在第2周达到峰值,继续治疗反而形成反弹,第4周的疗效反而不如第2周。这时,LOCF便不再保守,将受试者#2第2周时的血压值作为第4周的血压值纳入分析,会导致对试验组疗效的高估,这显然是不适合的。

那在这种情况下,我们应该怎么办呢?LOCF不适用,我们还有其他方法可以选择,比如MMRM(Mixed Model Repeated Measures),即重复测量混合效应模型。这个方法的特点是,可以根据同治疗组的其他受试者数据变化的趋势,来对缺失值进行填补,这就有效地避免了图2中显示的那种情况。

33.jpg

图3 MMRM填补

如图3所示,如果整组的疗效变化趋势是在第2周达到峰值,而后出现反弹,MMRM是可以正确的反映出这个趋势的(MMRM其实并非显式的填补,此处我们暂不做详细讨论)。

MMRM虽然避免了一些问题,但也带来了新的问题,也就是我们前面所说的,继续留在试验中的受试者,很可能有着更好的疗效,因此,根据留在试验中的受试者的数据变化趋势,对提前退出的受试者做缺失值填补,也很可能是不够保守、会高估整体疗效的。

近年来,有一种越来越流行的填补方式,叫做“基于对照模式的填补”。这种填补方式尤其适用于安慰剂对照的试验。简单来讲,就是对于试验组的受试者,在提前退出之后,我们假设他的疗效数据的变化趋势是会逐渐趋向于安慰剂组的。

 44.jpg

图4 基于对照模式的填补

如图4所示,试验组相对基线变化的均值(实线表示)有着明显的下降趋势;而对照组相对基线变化的均值(虚线表示)不仅没有下降,反而有少许的上升。一个试验组的受试者在Visit 2退出试验(图中用☆表示),我们假设他后面3次访视(Visit 3 -Visit 5)的数值不再按照本组的趋势变化,而是逐渐地丧失疗效,与对照组趋同。这种方法的好处是比较保守,不太可能高估试验组与对照组之间的差异,缺点是需要通过多重填补来实现,统计计算上比较复杂。

  总结  
总而言之,对于临床试验中疗效数据的缺失值,我们常常是需要进行处理的,而处理的方法有多种(仅基于对照模式的填补,其实就有很多种不同的做法)。不同的方法适用于不同的情况和假设。从“道”的层面来讲,应该与估计目标相联系,考虑在发生各种伴发事件的情况下,适合的缺失值处理策略。

本文尚未涉及这方面的讨论,仅仅对缺失值填补的原则和基本方法做一个粗浅的基础介绍,希望能够对非统计专业的读者有所帮助。

我们如何帮您呢?凯诺医药专业团队为您尽快提供服务