预防医学
上QQ阅读APP看书,第一时间看更新

四、诊断试验的偏倚

【问题12】

请指出以上案例中诊断试验可能存在哪些偏倚?并归纳诊断试验评价中偏倚类型。

思路:诊断试验的目的在于评价金标准和诊断试验结果的一致程度。在这个过程中,如研究设计、研究对象选择、金标准选择及其判断等环节,都会产生偏倚,进而影响诊断试验的应用价值。下面结合本章案例,介绍诊断试验可能出现的主要偏倚。

1.疾病谱偏倚(spectrum bias)

诊断试验的研究对象应具有代表性,病例应包括该疾病的所有自然呈现的各种疾病类型,对照组应选自确诊无该病的病例,不仅包括正常人群,更应包括来自与该疾病易混淆的病例。

通过前瞻性研究设计,可以获得“自然呈现”的各种疾病类型,对照组也更具可比性,如本章案例中研究者追踪了所有钼靶X线检查异常就诊者,直至获得病理组织学检查结果,从而包括了几乎所有的自然呈现的乳腺癌类型,对照大多是与乳腺癌容易混淆的良性乳腺病。许多研究者采用回顾性的病例对照研究方法进行诊断试验,特别强调病例组应包括各种临床期别(早、中、晚)、临床类型(轻、中、重)及典型和不典型的病例。显然,这种要求的病例不一定是“自然呈现”的疾病谱。进行疾病诊断与鉴别诊断时,大多数病人处于疾病的早期状态。因此,在以病例对照方法进行诊断试验时,较佳的病例应该是医院连续收集的新发病例,这样可使病例的疾病谱接近“自然呈现”状态。

疾病谱偏倚是一种选择性偏倚(selection bias),采用病例对照研究时容易出现。这种偏倚往往高估诊断试验的效果,因为这种设计会趋向于选择较典型的病例和不容易混淆的对照,使灵敏度和特异度虚高。

2.病情检查偏倚(work-up bias)

如果研究者将诊断试验结果阳性者都做金标准试验,而阴性者只抽一部分去做金标准试验,从而使试验结果产生偏性,也称为“部分确认性偏倚(partial verification bias)”,这在前瞻性研究中容易出现。在本章案例中,并不是所有进行乳房钼靶X线检查者随后都进行了病理组织学检查,即部分诊断试验阴性者没有做金标准试验。理论上,这种偏倚的后果将会导致敏感性偏高,而特异性偏低。减少此种病情检查偏倚的有效方法,是让全部受试对象同时接受诊断试验和金标准诊断,但现实中难以做到。由于此案例中仍有大量的良性乳腺病作为对照,也正是需要与乳腺癌鉴别的疾病,故对诊断试验结果影响有限。

3.参考试验偏倚(reference test bias)

也称为金标准偏倚。由于诊断试验的各项评价指标都是试验结果与金标准结果比较之后得出,则金标准选择不妥,就会造成错误分类,进而影响诊断试验的准确性。有两种情况会出现参考试验偏倚:

(1)金标准与所评价的诊断试验不独立:

如选用欲评价的诊断试验方法与另一诊断方法联合检测结果为“金标准”,其“金标准”结果必然不独立于所评价的诊断试验本身,易使其敏感度和特异度较真实值偏高,此时也称合并偏倚(incorporation bias)。

(2)多重参照偏倚(differential verification bias):

当金标准是一组试验方法时,纳入样本病例并非每一个都接受这组金标准,而是仅接受其中一种或几种金标准证实,或这部分样本病例是由这种金标准证实,而另一部分病例是由另一种金标准证实,这时就会出现多重参照偏倚。

4.评价偏倚(review bias)

临床诊断中大部分金标准或诊断试验的客观性是相对的。如果是回顾性研究设计,先有金标准结果,后进行诊断试验,由知情者判定结果,可能导致敏感度和特异度报道值高于真实值,故此类偏倚也称错误分类偏倚,克服此类偏倚的有效办法是采用盲法判定诊断试验结果。对于前瞻性研究,先进行诊断试验,往往要求金标准试验结果出来之前即确定诊断试验结果,而后进行金标准试验。金标准的判定有严格标准,特别像肿瘤等的病理检查不容易受诊断试验结果的影响,所以前瞻性设计时此类偏倚少见。尽管如此,前瞻性研究时也应尽量采用盲法。

5.疾病进展偏倚(disease progression bias)

于同一时间(或较短时间内)在同一名患者身上进行待评价试验和执行金标准试验并得出结论是最理想的。若诊断试验与金标准试验需要间隔较长时间进行,就可能出现因疾病自愈、干预治疗、进展至更严重阶段或是新疾病的出现导致同一个体疾病真实状态在两个时间点不一致,从而导致的诊断试验结果偏差叫疾病进展偏倚。