西游记第九十九回中,说到唐僧一行人取经归来,路过通天河,河中老鼋(yuán)本自愿驼他们过河,不料半途中,得知他们没有完成答应自己的事(向佛祖问寿数),老鼋一怒之下,将众人扔到水里。众人虽凭借法术安全上岸,但取回来的经卷都已湿透,只能放在石头上晾晒。收拾经卷的时候,有些书页粘在石头上取不下来,把经卷也撕破了。众人懊恼不已,孙悟空却说,天地本就不全,经文残缺,也是冥冥中应合了这个道理,非人力所能左右。
这个故事虽然扯得有点远,但如我们所知,无论是人生,还是临床试验,都不可能是完美无缺的。应对这些不完美,本就是我们工作和生活的一部分。而对于统计师而言,处理试验数据中的缺失值,是一项重要的工作。
假设在一个治疗高血压的试验中,我们一共随机化了100例受试者,但由于各种原因,其中20例受试者提前离开了试验,到了主要终点的观测时间点(比如第4周),仅剩80例受试者。那么,我们是不是可以仅将这80例受试者的数据用于分析,而忽略另外20例受试者呢?
简而言之,是不行的,至少是不够严谨的。为什么呢?请看下面这个小例子。
听说有这样一种骗局,有人号称自己能够预测股票的走势,而股票的走势,无非涨跌两种。第一天,他给1000人发信息,预测明天某某股票必涨;同时给另外1000人发信息,预测明天同一支股票会跌。第二天,等结果出来以后,只给猜对的那1000人继续发信息,同样的,也是跟其中的一半人说下一天这支股票要涨,跟另一半人说下一天这支股票要跌。然后第三天,第四天……重复这个操作,永远都只给猜对的那一半人继续发信息。这样反复几轮之后,虽然只剩下了很少的人,但是这部分人对这位“大神”的预测能力深信不疑,奉若神明,为下一步行骗打下了坚实的基础。而这位“大神”本身,当然是没有任何预测股票的能力的。
在临床试验中,也与上面这个例子相似,存在着“幸存者偏差”的问题(尽管不是人为刻意造成的),即效果好、副作用轻的人更倾向于留在试验中。如果疾病本身不是很严重,受试者人数又足够多,那么即使药物本身没有效果,也很可能会有若干“幸运儿”在试验中坚持到最后,并展现出很好的“疗效”。
因此,如果只分析留下来的受试者的数据,而完全忽视提前退出的受试者,我们就很有可能会过于乐观地估计疗效。但是,提前退出的受试者是没有收集到主要终点的观测数据的,没有数据,我们又如何将他们纳入分析呢?这就是我们今天的话题—缺失值填补。
一般来讲,对于确证性试验,主要分析应基于ITT原则,即把所有随机化的受试者都纳入分析。在上面那个高血压试验的例子中,我们本该纳入100例受试者,但其中仅80例受试者有主要终点的数据(第4周血压相对基线的下降值),如果我们仅分析这80人的数据,那就相当于我们的分析人群不再是ITT,而变成了“完成试验的受试者”这个人群,不仅人数大大减少(从100例减少到80例),而且结果也可能趋于乐观,这是监管机构所不能接受的。因此,我们必须对那20例没有观测到第4周血压值的受试者,进行缺失值填补,而保证我们最终依然有100个值用于分析。
这20个受试者的终点指标并没有观测到,要对它们进行填补,必然是基于某些假设的。“保守”是缺失值填补中的一大原则,也就是说,我们的假设应该是保守的,基于这些假设做出的填补,有很大可能会低估试验组的疗效,而不太可能高估试验组的疗效。大家可以想象,试验中存在缺失值,本来是一件缺憾的事情。但监管机构可以容许我们由于缺失值的存在而稍有“损失”(即低估疗效),而不太愿意看到我们由于缺失值的存在反而“获益”(即高估疗效)。所以,“保守原则”是我们需要考虑的。
有一种过去很常用、现在逐渐被取代的填补方法,叫做LOCF (Last Observation Carried Forward),即末次观测值结转法。它的做法非常简单,对于提前退出的受试者,直接把实际观测到的最后一个值带下来,作为主要终点(一般是End of Treatment)的观测值。这种方法有时候是保守的,有时侯是不保守的,我们可以看下面的两个例子。
图2 LOCF不保守的情况
那在这种情况下,我们应该怎么办呢?LOCF不适用,我们还有其他方法可以选择,比如MMRM(Mixed Model Repeated Measures),即重复测量混合效应模型。这个方法的特点是,可以根据同治疗组的其他受试者数据变化的趋势,来对缺失值进行填补,这就有效地避免了图2中显示的那种情况。
图3 MMRM填补
MMRM虽然避免了一些问题,但也带来了新的问题,也就是我们前面所说的,继续留在试验中的受试者,很可能有着更好的疗效,因此,根据留在试验中的受试者的数据变化趋势,对提前退出的受试者做缺失值填补,也很可能是不够保守、会高估整体疗效的。
近年来,有一种越来越流行的填补方式,叫做“基于对照模式的填补”。这种填补方式尤其适用于安慰剂对照的试验。简单来讲,就是对于试验组的受试者,在提前退出之后,我们假设他的疗效数据的变化趋势是会逐渐趋向于安慰剂组的。
本文尚未涉及这方面的讨论,仅仅对缺失值填补的原则和基本方法做一个粗浅的基础介绍,希望能够对非统计专业的读者有所帮助。