EN
【技术】实战教学编写dummy data,如此简单!
2023-07-26 17:06

对于DM,最基本的工作就是确保正式试验产生的受试者数据能够录入至EDC,在EDC上线前,需DM进行界面、逻辑测试,而测试过程中最重要的一项工作就是撰写测试数据(dummy data),接下来就让我们浅聊下,如何编写dummy data吧!

 信1.png


界面测试的dummy data

 

界面测试的目的是保证字段、表单名称、访视等与CRF一致,以及确保部分特殊字段可以录入至EDC。

 

例1:试验中大多仅可溯源到受试者既往病史的详细的年份,一般无法溯源到病史开始、结束的具体日期,这就要求病史开始、结束日期允许录入未知日期,且EDC不同,允许录入未知日期的格式也会不同,例如:eCollect系统可录入2017-UK-UK格式。

 

例2:血常规、血生化、血妊娠等实验室表单检查结果通常为数值型,或是包含“</>”的数值结果,而尿常规表单检查结果会存在数值、字符两种格式,尿常规表单检查可录入测试数据为“阴性、阳性、NEG”等,确认是否可支持文本型录入。

 

● 若数据库为CIMS系统,如血妊娠试验表单检查结果需设置为文本型,才可以录入包含“</>”的检查结果;若检查结果格式设置为数值型,仅可以录入数值型的结果,不支持录入“</>”符号,此时血妊娠表单测试数据可录入为“<100”。确认血妊娠表单检查结果是否设置为文本型,支持包含“</>”的检查结果录入。但后期数据清理环节,DM需增加对血妊娠表单的核查,避免误将“4.56”录入“4。56”等类似情况。

● 若数据库为eCollect或Rave系统,如血常规、血生化表单检查结果格式设置为数值型,也可以录入含“</>”的检查结果。

但需要注意的一点是:必须录入为英文状态下的“</>”,此时测试数据可撰写为“<100”,也可录入“阴性”测试血常规、血生化表单检查结果格式是否仅可录入数值型及包含“</>”的数值型检查结果。

 

例3:血常规、血生化表单检查项目会存在未查的情况,若使用Rave系统,可设置missing code:NA、ND等,测试时检查结果数据可录入为“NA、ND”,确认检查结果字段是否支持missing code录入;若使用CIMS系统,不支持missing code设置;若未做或本中心不适用该检查项目,临床意义评估选择“未查/不适用”,且留空检查结果即可。

 

信2.jpg

 

逻辑核查的dummy data

 

逻辑核查包含字段为空核查、日期比较核查、正常值范围核查、与入排相关的逻辑核查、时间窗核查等,为确保质疑可以正常触发,需撰写多套脏数据,同时为了保证正确的数据录入至EDC不会触发质疑,也需撰写1~2套干净数据进行测试。

 

脏数据

 

脏数据,是指错误的数据录入到系统中会触发可预期的系统质疑。

 

例1:

 

质疑文本为:“结束日期早于开始日期,请核实”

 

脏数据可编写为:开始日期=2023.1.1,结束日期=2022.12.31,录入至EDC后确认该质疑是否可以正确触发;

 

例2:

 

质疑文本为:“筛选期血红蛋白检查结果<90g/L,受试者是否符合入选标准且不符排除标准选择“是”,请核实。”

 

脏数据可编写为:筛选期访视下血常规表单血红蛋白检查结果=89g/L,入选排除表单中,“受试者是否符合入选标准且不符合排除标准”录入“是”;

 

例3:

 

质疑文本为“检查结果超出正常值范围,临床意义评估选择“正常”,请核实。”,若正常值范围设置为2.03~3.41(包含上、下限)

 

脏数据可编写为:

 

● 第1套:检查结果=3.411,临床意义评估选择“正常”;

 

● 第2套:检查结果=2.029,临床意义评估选择“正常”。若正常值范围设置为:<3.41,即正常值范围上限不包含3.41,此时脏数据可编写为:检查结果=3.41,临床意义评估选择“正常”,确认在检查结果=正常值范围上限时,是否可以正常触发质疑。

 

例4:

 

质疑文本为“筛选结果页面,入组阶段选择“剂量递增阶段”,且AE记录中第一行开始日期在C1D1访视研究药物输注开始日期后21+3天内,“是否为DLT”选择“不适用”,请核实。”

 

该质疑需要满足的条件:1、入组阶段=剂量递增阶段;2、AE记录中第1行开始日期在首次研究药物输注开始日期后21+3天内;3、对应AE记录中是否为DLT选择“不适用”,且这3个条件是and关系,缺一不可。

 

此时脏数据可录入为:

 

● 第1套:筛选结果页面,入组阶段选择“剂量递增阶段”,C1D1访视下研究药物输注开始日期=2022-03-01,AE记录第1行开始日期=2022-03-25(即AE开始日期=首次输注开始日期+21+3),是否为DLT选择“不适用”;

 

● 第2套:筛选结果页面,入组阶段选择“剂量递增阶段”,C1D1访视下研究药物输注开始日期=2022-03-01,AE记录第1行开始日期=2022-03-01(即AE开始日期=首次输注日期),是否为DLT选择“不适用”。

 

干净数据

 

干净数据,是指正确的数据录入到系统中不会触发系统质疑,符合逻辑核查程序的数据。

 

例1:

 

质疑文本为:“结束日期早于开始日期,请核实”

 

干净数据可编写为:开始日期=2022.12.01,结束日期=2022.12.31,该数据录入至EDC中不应触发质疑。

 

例2:

 

质疑文本为:“筛选期血红蛋白检查结果<90g/L,受试者是否符合入选标准且不符排除标准选择“是”,请核实。”

 

干净数据可编写为:筛选期访视下血常规表单血红蛋白检查结果=91g/L,入选排除表单中,“受试者是否符合入选标准且不符合排除标准”录入“是”。

 

也可以编写为:筛选期访视下血常规表单血红蛋白检查结果=89g/L,入选排除表单中,“受试者是否符合入选标准且不符合排除标准”录入“否”。

 

除此之外,该条质疑限制了访视,仅筛选期血红蛋白检查结果<90g/L,且入排询问选择“是”才可以触发质疑,则干净数据还可以编写为:D1访视血红蛋白结果=89g/L,入选排除表单中,“受试者是否符合入选标准且不符合排除标准”录入“是”,该干净数据录入至EDC是测试逻辑核查配置时,是否增加了访视的限制条件。

 

 

小结

 

数据库测试是一项繁复且细致的工作,需要做到全面考虑,正反双向测试,才能使后续数据录入工作更加准确、高效。


我们如何帮您呢?凯莱英临床(凯诺)专业团队为您尽快提供服务