【技术】天地尚无完体 – 浅谈缺失值填补的那点事-凯莱英临床（凯诺）

西游记第九十九回中，说到唐僧一行人取经归来，路过通天河，河中老鼋（yuán）本自愿驼他们过河，不料半途中，得知他们没有完成答应自己的事（向佛祖问寿数），老鼋一怒之下，将众人扔到水里。众人虽凭借法术安全上岸，但取回来的经卷都已湿透，只能放在石头上晾晒。收拾经卷的时候，有些书页粘在石头上取不下来，把经卷也撕破了。众人懊恼不已，孙悟空却说，天地本就不全，经文残缺，也是冥冥中应合了这个道理，非人力所能左右。

这个故事虽然扯得有点远，但如我们所知，无论是人生，还是临床试验，都不可能是完美无缺的。应对这些不完美，本就是我们工作和生活的一部分。而对于统计师而言，处理试验数据中的缺失值，是一项重要的工作。

假设在一个治疗高血压的试验中，我们一共随机化了100例受试者，但由于各种原因，其中20例受试者提前离开了试验，到了主要终点的观测时间点（比如第4周），仅剩80例受试者。那么，我们是不是可以仅将这80例受试者的数据用于分析，而忽略另外20例受试者呢？

简而言之，是不行的，至少是不够严谨的。为什么呢？请看下面这个小例子。

听说有这样一种骗局，有人号称自己能够预测股票的走势，而股票的走势，无非涨跌两种。第一天，他给1000人发信息，预测明天某某股票必涨；同时给另外1000人发信息，预测明天同一支股票会跌。第二天，等结果出来以后，只给猜对的那1000人继续发信息，同样的，也是跟其中的一半人说下一天这支股票要涨，跟另一半人说下一天这支股票要跌。然后第三天，第四天……重复这个操作，永远都只给猜对的那一半人继续发信息。这样反复几轮之后，虽然只剩下了很少的人，但是这部分人对这位“大神”的预测能力深信不疑，奉若神明，为下一步行骗打下了坚实的基础。而这位“大神”本身，当然是没有任何预测股票的能力的。

在临床试验中，也与上面这个例子相似，存在着“幸存者偏差”的问题（尽管不是人为刻意造成的），即效果好、副作用轻的人更倾向于留在试验中。如果疾病本身不是很严重，受试者人数又足够多，那么即使药物本身没有效果，也很可能会有若干“幸运儿”在试验中坚持到最后，并展现出很好的“疗效”。

因此，如果只分析留下来的受试者的数据，而完全忽视提前退出的受试者，我们就很有可能会过于乐观地估计疗效。但是，提前退出的受试者是没有收集到主要终点的观测数据的，没有数据，我们又如何将他们纳入分析呢？这就是我们今天的话题—缺失值填补。

01 缺失值填补

缺失值填补，简单来说就是，人为的地给我们没有观测到的变量赋予一个值，并将这个值用于分析。这样做，虽然听起来可能比较主观，不太科学，但实际上，这也是我们不得不采取的措施。

一般来讲，对于确证性试验，主要分析应基于ITT原则，即把所有随机化的受试者都纳入分析。在上面那个高血压试验的例子中，我们本该纳入100例受试者，但其中仅80例受试者有主要终点的数据（第4周血压相对基线的下降值），如果我们仅分析这80人的数据，那就相当于我们的分析人群不再是ITT，而变成了“完成试验的受试者”这个人群，不仅人数大大减少（从100例减少到80例），而且结果也可能趋于乐观，这是监管机构所不能接受的。因此，我们必须对那20例没有观测到第4周血压值的受试者，进行缺失值填补，而保证我们最终依然有100个值用于分析。

这20个受试者的终点指标并没有观测到，要对它们进行填补，必然是基于某些假设的。“保守”是缺失值填补中的一大原则，也就是说，我们的假设应该是保守的，基于这些假设做出的填补，有很大可能会低估试验组的疗效，而不太可能高估试验组的疗效。大家可以想象，试验中存在缺失值，本来是一件缺憾的事情。但监管机构可以容许我们由于缺失值的存在而稍有“损失”（即低估疗效），而不太愿意看到我们由于缺失值的存在反而“获益”（即高估疗效）。所以，“保守原则”是我们需要考虑的。

02 缺失值填补常用统计方法

下面让我们来看一下缺失值填补的常用统计方法：

有一种过去很常用、现在逐渐被取代的填补方法，叫做LOCF （Last Observation Carried Forward），即末次观测值结转法。它的做法非常简单，对于提前退出的受试者，直接把实际观测到的最后一个值带下来，作为主要终点（一般是End of Treatment）的观测值。这种方法有时候是保守的，有时侯是不保守的，我们可以看下面的两个例子。

图1 LOCF保守的情况

还是考虑第4周时血压相对基线下降的情况。假设图中的4个受试者都来自试验组，其中受试者#1、#3、#4都完成了4周的治疗，只有受试者#2（蓝色线）在第2周时提前退出。从图1中可以看出，用药后血压相对于基线，确实有明显的下降趋势，且降幅越来越大。在这种情况下，LOCF是保守的，将受试者#2第2周时的血压值作为第4周的血压值纳入分析，很可能是会低估了试验组的疗效的。

图2 LOCF不保守的情况

而图2中的情况，就完全不是这么回事了。同样还是受试者#1、#3、#4都完成了4周的治疗，受试者#2在第2周时提前退出，但药物的疗效出现了变化。这一次血压的降幅在第2周达到峰值，继续治疗反而形成反弹，第4周的疗效反而不如第2周。这时，LOCF便不再保守，将受试者#2第2周时的血压值作为第4周的血压值纳入分析，会导致对试验组疗效的高估，这显然是不适合的。

那在这种情况下，我们应该怎么办呢？LOCF不适用，我们还有其他方法可以选择，比如MMRM（Mixed Model Repeated Measures），即重复测量混合效应模型。这个方法的特点是，可以根据同治疗组的其他受试者数据变化的趋势，来对缺失值进行填补，这就有效地避免了图2中显示的那种情况。

图3 MMRM填补

如图3所示，如果整组的疗效变化趋势是在第2周达到峰值，而后出现反弹，MMRM是可以正确的反映出这个趋势的（MMRM其实并非显式的填补，此处我们暂不做详细讨论）。

MMRM虽然避免了一些问题，但也带来了新的问题，也就是我们前面所说的，继续留在试验中的受试者，很可能有着更好的疗效，因此，根据留在试验中的受试者的数据变化趋势，对提前退出的受试者做缺失值填补，也很可能是不够保守、会高估整体疗效的。

近年来，有一种越来越流行的填补方式，叫做“基于对照模式的填补”。这种填补方式尤其适用于安慰剂对照的试验。简单来讲，就是对于试验组的受试者，在提前退出之后，我们假设他的疗效数据的变化趋势是会逐渐趋向于安慰剂组的。

图4 基于对照模式的填补

如图4所示，试验组相对基线变化的均值（实线表示）有着明显的下降趋势；而对照组相对基线变化的均值（虚线表示）不仅没有下降，反而有少许的上升。一个试验组的受试者在Visit 2退出试验（图中用☆表示），我们假设他后面3次访视（Visit 3 -Visit 5）的数值不再按照本组的趋势变化，而是逐渐地丧失疗效，与对照组趋同。这种方法的好处是比较保守，不太可能高估试验组与对照组之间的差异，缺点是需要通过多重填补来实现，统计计算上比较复杂。

总结

总而言之，对于临床试验中疗效数据的缺失值，我们常常是需要进行处理的，而处理的方法有多种（仅基于对照模式的填补，其实就有很多种不同的做法）。不同的方法适用于不同的情况和假设。从“道”的层面来讲，应该与估计目标相联系，考虑在发生各种伴发事件的情况下，适合的缺失值处理策略。

本文尚未涉及这方面的讨论，仅仅对缺失值填补的原则和基本方法做一个粗浅的基础介绍，希望能够对非统计专业的读者有所帮助。

相关新闻