表2. 输血及血制品不同用量与HCV感染
表3. 不同烧伤程度与HCV感染
案例解析:首先,该试验研究的目的是探索“HCV感染与否”与年龄、有无输血及血制品、输血及血制品的量、烧伤程度之间的关系,然而研究者仅采用了单因素分析方法,分别将每一项研究因素与HCV感染之间的关系进行了列联表χ2检验,显然这样做是不合理的。在进行单因素分析时,忽略了其他因素可能的影响,以及研究因素之间的相互影响,当结果为P<0.05时,并不能说明就是该因素的作用。
该资料可以采用Logistic回归方法,以“HCV感染与否”作为因变量,年龄、有无输血及血制品等作为自变量进行分析,筛选有意义的变量,并且可以计算OR值来说明自变量对因变量的影响。
此外,该研究还存在其他问题。例如,年龄、烧伤程度都是有序分类资料,用列联表χ2检验是不正确的,应该使用秩和检验。
4
诊断确定性恰当评价
诊断确定性评价:诊断试验准确性研究的问题来源于临床,其结果也将应用于临床,为临床实践提供证据。在提出临床问题时,可采用PICOS(P:Patient;I:Intervention;C:Comparison;O:Outcome;S:Study design)原则将其转化为科学问题。诊断试验准确性研究中,P为疑诊某病的患者;I为待评价的诊断试验;C为诊断金标准;O为诊断准确性评价,包括灵敏度、特异度、预测值(predictive value, PV)和似然比(likelihood ratio, LR)。
在评价诊断试验准确性时,需将试验结果按照阳性和阴性进行分类,许多诊断试验,尤其是实验室检测,其测量结果多为连续性变量。对于连续性变量,需要选择区分正常与异常的截点值(cut-off point),即界值。
诊断试验中确定最佳截点值的方法包括:
(1)均数±标准差法:当测量值为正态分布时,双侧正常值范围常用“均数±1.96标准差”界定;单侧则用“均数 1.64标准差”或“均数-1.64标准差”界定。
(2)百分位数法:当测量值为偏态分布或分布类型尚不能确定时,双侧正常值范围常用“P 2.5~P 97.5”界定;单侧用“P 95”或“P 5”界定。
(3)ROC曲线法:诊断试验的结果为连续性变量时,依照不同截点值可分别计算出灵敏度和特异度,以诊断试验的灵敏度为纵坐标、以1-特异度为横坐标,绘制成连续曲线,即为ROC曲线(图1)。
图1受试者工作特征曲线
ROC曲线上最靠近左上方的点对应的截点值即为最佳截点值。ROC曲线下面积反映了诊断试验的准确性,取值范围在0.5~1.0。ROC曲线越向左上偏,曲线下面积越大,该诊断试验的准确性越高。
因此,除可用于确立截点值外,ROC曲线还可比较两个或以上独立诊断试验的准确性,如图2中诊断试验1的准确性优于诊断试验2。ROC曲线简单、直观,是确定诊断试验截点值较为常用的方法。
【例4】为鉴别胃癌、胃炎、非胃病患者,各测定了50名对象的铜蓝蛋白指标,观察结果如下如下:
案例解析:基于上表中我们可以看出非胃病组的铜蓝蛋指标远低于胃癌组,那我们是否可以给出结论铜蓝蛋白是胃癌诊断标志物呢?显然也是不合理的~我们只能得出铜蓝蛋白在这三组中指标有差异,要想确定是不是诊断标志物,就要按照诊断试验的标准去统计分析,知道铜蓝蛋白诊断胃癌的ROC曲线面积、AUC大小、敏感度、特异度等等。
小结
1.临床需求决定研究目的、研究目的和现有资源决定科研设计、科研设计决定统计学分析,大家不要整反了,首先要明确你的试验目的和科研设计。
2.临床统计学中,软件操作相对次要的,知道统计学方法的“适用范围和“临床解释”才是最关键的。不懂统计学方法就盲目去学习软件操作可能会一用就错,错也不知错在何处。
3.临床研究虽说不能没有统计,但是也不能全靠统计。有些时候试验结果虽然有统计学意义,但不一定有专业意义,反之亦然。例如一种降压药物相比标准降压药物降压1mmHg,即使p值<0.05,也没有什么临床意义。
4.很多中文杂志甚至是SCI杂志时常会出现试验设计或统计学错误,学习统计学的第一步就是不犯错!知道哪些雷区不能触碰,后面唐老鸭会继续分析根据不同的临床研究如何选择统计学方法,以及统计学错误案例,下期见咯~