近日,凯莱英临床(凯诺)在由医麦客旗下品牌星耀研究院发起的2023-2024年度生物创新药行业星耀榜的评选中,以业内优异的服务能力,荣获“2024 生物创新药领域本土CXO服务卓越供应商TOP10”称号。
同期,我司医学统计高级总监 渠翊博士的《人工判断 vs 模型选择,孰优孰劣?——在肿瘤早期试验中,比较基于3+3结合疗效评估进行剂量选择的方法和BOIN12法》文章也成功入选同期举办的2024 IBI EXPO 国际生物创新药产业大会壁报展示,壁报内容以专业的内容分析和深入的结果讨论对比,吸引多数现场观众驻足观看。
本次壁报的详细内容,请详看下文
一 、背景
对于肿瘤早期试验而言,为后续开发选择合适的剂量,是最重要的目的之一。3+3是一种传统的基于安全性(即毒性事件发生率)来进行剂量爬坡的方法。在爬坡结束并确定MTD(最大耐受剂量)之后,通常会在毒性可接受的剂量范围之内,结合疗效评估结果(如肿瘤的最佳缓解率等),选择2-3个剂量进行扩展。而后根据剂量爬坡和扩展阶段的疗效和安全性结果,对各剂量进行综合评估,选取出进入下一阶段研究的剂量(即RP2D)。以上评估过程往往不基于统计算法,而是由人工来完成。
BOIN12是一种新兴的肿瘤I/II期试验设计方法,它可以在统计模型的辅助下,综合评估各剂量的毒性和有效性,从而完成剂量爬坡和剂量选择。
在本文中,我们利用计算机模拟数据,对这两种方法进行比较,以评估它们在剂量选择方面的正确率。目前,已有文献对BOIN12选择的剂量和3+3选出的MTD进行比较。在这个比较中,3+3具有天然的劣势,因为它只考虑了安全性,而不考虑有效性。而事实上,即使我们采用3+3的方法爬坡,对需要扩展的剂量和最终的RP2D做出选择的时候,也是会重点关注有效性的。
因此,可以说这种比较对3+3并不公平,或者说无法反映出BOIN12相对于临床上常用的这种3+3+人工疗效评估的方法,是否真的具有优势。在本文中,我们尝试对这个问题做出探索,研究方法方面主要参考BOIN12的论文(Lin et al. 2020)。
二 、方法
虽然3+3是一种仅基于安全性(或者说毒性)来进行剂量爬坡的方法,在对需要扩展的剂量和最终的RP2D做出选择的时候,通常也会考虑各剂量的有效性结果,进行综合评估,只不过这个步骤由人工来完成,而非由统计算法来完成。通常也没有一个非常明确、可以用公式来表示的判断规则。为增加这种3+3结合疗效评估的方法与BOIN12法的可比性,我们假设在用这两种方法对各剂量进行评估的时候,对于毒性和疗效结果,均采用BOIN12法的默认权重(见下表)来计算每个剂量的功效得分,并在可选的剂量范围内,选择功效得分最高的剂量进入下一阶段。
即,
如果某剂量下,如果一个受试者未发生毒性事件且显示出疗效(如肿瘤评估达到完全缓解或部分缓解),则积100分;
如果一个受试者发生了毒性事件且显示出疗效,则积60分;
如果一个受试者未发生毒性事件且未显示出疗效,则积40分;
如果一个受试者发生了毒性事件且未显示出疗效,则积0分。
计算同一剂量下所有受试者的总得分,作为该剂量的功效得分,并基于功效得分来进行剂量选择。
我们假设一共有5个剂量需要探索,对于3+3结合疗效评估的方法(以下简称3+3),我们首先采用3+3设计进行剂量爬坡,然后在MTD及以下剂量中,基于总功效得分,选出2个最佳剂量,分别扩展到9例受试者;然后根据这9例受试者的总功效得分,选择最佳剂量作为RP2D。对于BOIN12法,我们利用trialdesign.cn网站做数据模拟,为了增加与3+3方法的可比性,我们设定3例受试者为一个cohort,每个剂量最多9例受试者,整个试验最多36例受试者,允许的毒性上限为0.3,其他参数采用默认设置。
我们设置了9个场景,下图显示在每个场景下,每个剂量发生毒性事件和显现出疗效的真实概率,以及功效得分。
图中,红色实线表示发生毒性事件的概率;绿色实线表示显现出疗效的概率;红色虚线为毒性概率=0.3的参考线;绿色虚线为有效性概率=0.25的参考性;紫色实线为功效得分(为方便在图中展示,将原始得分做了线性转化);紫色*表示应该选择的剂量,即毒性概率低于0.3且功效得分最高的剂量。
同一受试者的毒性和有效性结果具有关联性,我们假设相关系数为 -0.7到0.7(间隔0.1),分别做了模拟。对每个场景下和每个相关系数分别做了1000次模拟试验,而后根据模拟试验的结果,对两种方法进行比较。
三 、结果
首先,我们在每个场景下,对所有的模拟结果进行合并(即不区分相关系数),两个方法的剂量选择正确率如下图所示:
可以看到,除了场景#8和#9之外,在其他场景中,BOIN12法相比于3+3方法,均显示出明显的优势。在场景#8和#9中,两种方法的正确率相近,3+3略高。
而后,我们统计了每个场景中,在不同相关系数取值的情况下,两种方法的正确率。
从上图可以看出,不同的相关系数对两种方法的正确率的影响均不明显,也没有看到正确率随着相关系数的变化而整体升高或降低的趋势。
四 、讨论
在肿瘤I期试验中,经常采用传统的3+3方法进行剂量爬坡,而后从MTD及以下的剂量中,综合疗效和安全性的表现,选择剂量进行扩展,之后再合并剂量爬坡和扩展阶段的结果,选出RP2D。此法虽然在爬坡阶段只考虑安全性,但在做剂量选择的时候,也和BOIN12法一样,对疗效和安全性做了综合考虑,只不过是由人工来完成,没有明显的公式或算法的指导。
本研究利用模拟数据,在同等条件下,将此法与BOIN12法做了比较。结果显示,在大部分场景下BOIN12法在剂量选择的正确率方面显示出明显的优势,这可能与3+3法在剂量递增阶段较保守,造成爬坡过早终止,或者某些剂量下人数过少,探索不完全,结果偶然性较大有关。同一受试者的毒性和有效性结果之间的相关性对两种方法的正确率的影响均不明显。在模拟试验中,我们假设3+3方法在爬坡之后,选择2个最优剂量进行扩展。我们同样也尝试过选取3个最优剂量进行扩展,在各个场景下,剂量选择的正确率与2个最优剂量扩展的结果相近或略优,在大多数场景中,仍明显落后于BOIN12(具体数据未展示)。
参考文献
Lin R, Zhou Y, Yan F, Li D, Yuan Y. BOIN12: Bayesian Optimal Interval Phase I/II Trial Design for Utility-Based Dose Finding in Immunotherapy and Targeted Therapies. JCO Precis Oncol. 2020 Nov 16;4:PO.20.00257. doi: 10.1200/PO.20.00257. PMID: 33283133; PMCID: PMC7713525.