一、如何定义数据集?数据集,即用于统计分析的数据的集合。那么根据什么原则筛选数据,如何定义数据集呢?目前,随机化是控制偏倚最常用和有效的措施,大部分临床试验采用的都是随机对照试验(RandomizedControlledTrial,RCT)。既然入组患者已经按照随机化分好了组别,无论后续有什么变化,都按照最初的随机化分组进行分析,总归是没有错的,这种做法专业一点讲叫做遵循意向性(IntentionToTreat,ITT)原则。但是,试验过程中总会有不依从的对象存在,就像开头讲到的李阿姨,刚刚拿到分组结果就退出了试验,把这样的患者纳入岂不是会影响最终的结果吗?为了进一步消除类似李阿姨这种病例对最终结果的影响,我们可以对数据集进行多种定义。二、数据集的种类针对不同的分析目的,可以采用不同类型的数据集,也可以根据试验的实际情况自行定义。临床试验中常见的数据集有以下四种。1.意向性治疗分析集(IntentionToTreat,ITT)无论受试者实际接受了何种治疗,都将受试者按照随机化分组结果进行统计分析,例如前文提到的李阿姨,虽然实际上并没有接受相应的治疗,也依然要纳入分析。但是,在实际的临床试验中,有些受试者在用药前撤回知情同意,退出了试验,甚至连基线信息都没有,如果将其纳入最后的统计分析,就会影响药物真实疗效的评价。因此,考虑到实际情况,可以根据ITT原则对数据集进行适当的修正,称为调整的ITT数据集(modifiedITT,mITT)。例如,2019年发表在JAMA上的一篇临床试验研究中[1],在ITT分析集中按照随机化分组结果纳入了全部受试者。但是,有两位研究对象并没有按照随机化的结果接受试验药lefamulin的治疗,所以mITT集则将这两位受试者剔除。图片来源:JAMA.2019;322(17):1661-1671.2.全分析集(fullanalysisset,FAS)FAS在专业书籍上的定义是:根据意向性原则,在所有随机化受试者中以最小和合理的方法剔除不符合条件者后得到的受试者集合[2]。FAS集也是一种mITT数据集。翻译一下就是,用最少的条件剔除不合格的受试者。最常见的剔除条件是至少使用了一剂试验药物,这样开头提到的没有使用药物的李阿姨就被剔除掉了。例如,2020年发表于Lancet上的一篇临床试验文章就采用了FAS进行分析[3]。图片来源:Lancet2020;396:255–66.3.符合方案集(PerProtocolSet,PPS)先来一波教科书般的名词解释:又称「合格病例」或「可评价病例」样本,是全分析集的一个子集。PPS集中的受试者依从性良好、符合试验方案、试验期间未服用禁...