本文将以中文项目为例,简单介绍SAS程序员日常工作所涉及的一些指导原则,希望能帮助大家了解SAS程序员的工作。
SAS程序员的工作内容一般包括:
注释CRF(空白病例表)
产生SDTM数据集明细
产生/验证SDTM数据集
产生ADaM数据集明细
产生/验证ADaM数据集
产生和验证表格/列表/图表
产生Define-XML和审阅者指南
以上这些工作内容均与临床试验数据的递交息息相关。
临床试验可能会涉及多个国家、多个语言、多个中心。设想一下,假如提交给监管机构的数据格式不统一,那么对于监管机构的审评和跨临床试验数据的分析工作将面临诸多困难。因此,制作临床试验数据相关资料的SAS程序员需要参考并遵守相关的指导原则。
以中文项目递交为例,常用的指导原则是国家药品监督管理局药品审评中心官网上的eCTD相关指导原则《药物临床试验数据递交指导原则》。
递交指导原则中对临床试验数据相关资料进行了说明,包括原始数据库、分析数据库、数据说明文件、数据审阅说明、注释病例报告表和程序代码。
一、原始数据库
1)是原始数据(raw data)
2)不能用EDC(电子数据采集系统)直接导出进行递交
3)需要必要的标准化或编码
4)CDISC标准下,SDTM数据库就是原始数据库
非CDISC标准下的原始数据库,是指经过一定处理从EDC导出的数据集。如果是CDISC(Clinical Data Interchange Standards Consortium,临床数据交换标准协会)标准,那么由程序员产生SDTM数据集来创建原始数据库。中文项目SDTM数据集的制作一般参考SDTMIG v3.2 SDTM 实施指南中文翻译版。SDTM数据库的制作可以理解为将EDC中的变量内容按照符合指南规定的标准来重新放置,以实现临床试验数据格式的统一化。
二、分析数据库
1)在原始数据的基础上衍生数据
2)CDISC标准下,ADaM数据库就是分析数据库
分析数据库由程序员产生。在原始数据库的基础上,根据不同项目制定的统计分析计划和图表模板进行衍生。中文项目ADaM数据集的制作一般参考ADaMIG_v1.1_中文翻译版本。ADaM数据库需要包含分析时使用的所有变量,变量的内容和来源需要在数据说明文件中清晰的描述以实现可追溯性。ADaM数据库做的越完善,实现统计分析所需要的编程步骤就越少。
三、数据说明文件
原始数据库对应的数据说明文件有建库说明文件或者SDTM Define-XML(CDISC标准),分析数据库对应的说明文件有分析数据集明细(Specification)或者ADaM Define-XML。文件以PDF的形式递交,如果是Define-XML需要递交XML文件和对应的XSL样式文件。
四、数据审阅说明
一般是指审阅者指南,包括CSDRG(Clinical Study Data Reviewer’s Guide)和ADRG(Analysis Data Reviewer’s Guide)。其中,CSDRG是指临床研究数据审阅者指南,ADRG是指分析数据审阅者指南。数据审阅说明是对数据说明文件进一步补充,内容包括数据集和术语的额外解释、数据一致性总结、附录(--TEST检查项名称超过40个字符或IETEST入选/排除标准超过200个字符的完整描述)等。
五、注释病例报告表
如果不按照CDISC标准递交,一般使用Unique aCRF(注释病例报告表)文件或者整册aCRF,由项目中的数据管理员来准备。完全按照CDISC标准递交时,程序员需要在Unique eCRF(空白病例报告表)文件中进行标注形成aCRF。其中需要注意的是CRF中可能会收集一些递交数据库中没有的数据内容,这类数据需要在aCRF中明确标注为“不递交”,并在数据审阅说明中阐明不递交的理由。
六、程序代码
1)易懂、可读性强
2)充分的注释
3)避免外部(宏)程序调用
可以通过对程序、数据集和变量进行逻辑性的命名、指定缩进样式(制表符或空格)等来实现代码的可读性。因为临床试验项目一般持续时间比较长,在此期间极有可能发生程序员的替换和程序的反复修改,所以在编程时做好充分的注释显得极为重要。
七、其他
关于创建支持临床研究报告的表格、列表和图表,在实际工作中程序员通常按照统计师撰写的SAP(Statistical Analysis Plan,统计分析计划)和Shell(统计图表模板)进行制作。
Shell一般有特定的顺序,比如说14.1下放的是人口学的数据,列表的编号从16.2开始。这是因为参考了ICH(International Conference on Harmonisation,国际人用药品注册技术协调会)人类临床研究相关指导原则(下图为E3:临床研究报告的结构与内容部分节选)。在实际工作中,Lead程序员需要审阅图表模板,这也是其中一项。
总结
悬衡而知平,设规而知圆。各种专业指导原则,给数据统计分析和递交工作的开展提供了准确良好的依据。
参考文献
1.药物临床试验数据递交指导原则(试行)(2020年第16号)
https://www.cde.org.cn/ectd/listpage/fc528384dbd9f6691ff56f7e1167b4ad
2. E3:临床研究报告的结构与内容
https://www.cde.org.cn/ichWeb/guideIch/toGuideIch/0/1
3.SDTMIG v3.2 SDTM 实施指南中文翻译版
https://www.cdisc.org/translations/chinese
4.ADaMIG_v1.1_中文翻译版本
https://www.cdisc.org/translations/chinese