前言
数据库质量控制是一个动态的过程,项目运行阶段可根据申办者或项目需要随时开展(但至少进行一次QC)。在每个临床研究项目数据库锁定之前,数据管理人员需对数据库做最后一次核查,从而确保数据库在锁定之前符合质量要求并可进行分析。
数据库质控工作通常由质控人员(独立DM或指定人员)来完成。其中,对质疑列表进行的随机抽样,在质控工作中是较为关键的一个操作。通常会根据相关要求,分别对关键变量质疑、非关键变量质疑进行抽样,随机抽样的工具也有多种选择。
本文介绍的随机抽样工具为Excel抽样,即通过Excel的数据分析功能进行抽样。当然在随机抽样前,需提前做好准备,如下方介绍或根据对应SOP流程做好其他方面的准备:
筛选出随机成功/已入组受试者人工关闭的质疑;
根据已确定的关键变量,将上述筛选好的质疑分为关键变量质疑、非关键变量质疑。
抽样工具介绍
添加“数据分析”,若“数据”菜单中已添加“数据分析”,该步骤可省略。
选择“文件” “选项” “加载项” “转到” 勾选“分析工具库” “确定” “数据”菜单中即可出现“数据分析”。
随机抽样
在选择需要抽样的样本时,需确定每条质疑都有唯一、不重复的OID对应;若无,则可需新增一列“序号”,赋予每条质疑唯一的OID。
选择“数据” “数据分析” 分析工具选择“抽样” “确定” 选择“输入区域”即需要抽样的单元格区域 填写“随机样本数” 选择“输出区域” “确定”。
通过IF函数与COUNTIF函数将抽样结果与A列序号一一对应,并复制粘贴文本至关键变量/非关键变量sheet,得到需核查的质疑条目。
特别提醒
在随机抽样中,任一数据都可能被抽取多次。所以在实际中我们需要适当调整随机样本数,保证去掉重复值后满足抽样需求。
利用“开始条件格式突出显示单元格规则重复值”功能可以标识出重复值;
利用“数据删除重复值”功能可以删除重复值。
若去除重复值后的抽样结果小于所需随机样本数,建议增加随机样本数,再次进行随机抽样。
若去除重复值后的抽样结果大于所需随机样本数,需对去除重复值后的抽样结果再次进行抽样。第二次抽样的随机样本数为超出所需随机样本数的样本数(即去重后第一次随机样本数减去所需随机样本数),删除第一次抽样结果中的第二次抽样得到的样本即得到最终的抽样结果。
看完以上介绍之后,相信大家对Excel抽样工具有了一定的了解,大家可以在之后的工作中逐渐掌握该项功能。Excel抽样作为质控人员较为常用的抽样工具,熟悉它可以让我们更好地完成数据库质控工作。