Radiology:深度学习算法在钼靶乳腺癌筛查检测中的应用
医疗资讯网-妇科问诊
现阶段,传统的计算机辅助检测算法已被用作乳腺钼靶筛查项目的临床决策支持系统。然而,计算机辅助检测系统已被证明可以提高召回率,但在阅读者诊断性能方面几乎没有改善。关于深度学习(DL)算法在乳腺钼靶筛查中的应用的四项系统综述和荟萃分析显示,自2017年以来,证据迅速增加。少数研究表明,与医师相比,DL算法作为单个医师的性能并不差。结果很有希望,深度学习算法可以在保持相同阅读标准的情况下取代双重阅读程序中的一个医师,并有可能通过检测不同的癌症来提高癌症的早期检测。然而据我们所知,与标准双重阅读相比,没有一个独立的算法在保持可接受的召回率的情况下表现出更好的性能。这表明DL算法目前不会完全取代人类在双读程序中的阅读。前面提到的系统综述强调,由于使用小测试队列、缺乏外部测试和缺乏预设的性能阈值,许多研究受到偏倚的限制。此外,许多先前的研究没有包括间隔期和下一轮癌症的数据,这对于研究早期检测DL算法的影响是必要的。很少有算法在相同的外部独立数据集上对可接受的性能阈值进行比较基准测试。
最近,发表在Radiology 上的一篇文章验证了三种深度学习算法作为独立乳腺钼靶阅读器的性能,以及在双读系统中与医师一起使用时的性能。
本项回顾性研究于2022年1月至2022年6月期间对三种商业DL算法(DL-1、DL-2和DL-3)使用1年(2017年)期间在英国两个地点收集的连续乳腺钼靶图像进行了评估。研究随访了3年的正常病例和在筛查时(该轮或下一轮)或3年内发现的经组织病理学证实的癌症病例被包括在内。预设的特异性阈值相当于一名医师。以敏感性和特异性为主要指标,评估独立DL阅读与单个人阅读的性能,以及DL阅读与双人阅读的性能。P < 0.025被认为是非劣效性检验具有统计学意义。
研究共纳入26722例患者(患者中位年龄59.0岁[IQR, 54.0-63.0岁]),使用两家供应商的机器获得乳腺钼靶图像。其中筛检332例,间隔期174例,下一轮254例。三种独立深度学习算法中有两种达到了良好的灵敏度(DL-1: 64.8%, P < 0.001;Dl-2: 56.7%, p = 0.03;DL-3: 58.9%, P < 0.001),与单一第一解读器(62.8%)相比,DL-1的特异性不差(92.8%;P < 0.001)和DL-2 (96.8%;P < 0.001),且DL-3优于(97.9%;P < 0.001),与单一第一读者(96.5%)相比。将DL算法与人类读者相结合,DL-1、DL-2和DL-3的灵敏度分别为67.0%、65.6%和65.4%;P < 0.001),与双读(67.4%)相比,特异度更高(97.4%、97.6%和97.6%;P < 0.001)。
表 不同病例和病变的癌症特征
本项研究表明,使用独立的深度学习算法与人工阅读器相结合可以在减少工作量的同时保持筛查的准确性。
原文出处:
Sarah E Hickman,Nicholas R Payne,Richard T Black,et al.Deep Learning Algorithms for Breast Cancer Detection in a UK Screening Cohort: As Stand-alone Readers and Combined with Human Readers.DOI:10.1148/radiol.233147