Radiology:人工智能检测间隔期乳腺癌的准确性及价值

医疗资讯网-妇科问诊

筛查性乳腺钼靶检查被认为是早期发现乳腺癌和降低乳腺癌死亡率的标准。许多国家都建立了有组织的乳腺癌筛查项目,尽管在筛查年龄、筛查间隔、乳腺钼靶检查是否由一名或两名读者报告等方面存在一些差异。其中一些差异可能会影响间隔癌(IC)率(即在两轮筛查之间诊断出的癌症比例),这被认为是筛查质量的衡量标准。较短的筛查间隔往往会降低快速增长的偶发IC(真IC)的数量。重复读数可以减少钼靶筛查中出现但被忽视的IC的数量,并可以将癌症检出率提高6%-10%,但代价是工作量增加。英国以人群为基础的筛查项目为50-70岁的女性提供三年一次的双视图全视野数字钼靶检查。两位专家读者检查钼靶图像,与第三位读者进行仲裁以解决分歧。在回顾性研究中,人工智能(AI)系统在乳腺癌检测方面的表现不逊于单个人类读者,在一项与人工智能合作的前瞻性研究中,人工智能(AI)系统表现相当。


最近,发表在Radiology杂志上的一篇研究回顾性评价用于筛查乳腺钼靶中IC检测的商用AI系统,评估AI识别病变位置的准确性,并分析AI系统定位的IC的组织病理学特征。 

本项研究使用商业人工智能系统,在2011年1月至2018年12月期间由两名读者评估的筛查性乳腺钼靶检查数据集(患者年龄中位数为57岁[IQR, 52-64岁])进行回顾性分析。人工智能输出是病变位置(热图)和每个病例的最高每病变风险评分(范围,0-100)。如果AI热图出现在正常筛查乳腺钼靶或IC筛查钼靶图像上(即随后诊断为IC的患者),但在癌症边界之外,则被认为是假阳性(FP)。放射学顾问专家小组将IC分为正常或良性(真阴性[TN])、不确定(最小恶性征象[MS])或可疑(假阴性[FN])。采用Mann-Whitney U检验、Kruskal-Wallis检验和χ2检验进行组间比较。

研究共纳入筛查性乳腺钼靶图像2052张,其中异常图像514张,正常图像1548张。TN组AI风险评分中位数为50 (IQR, 32-82), MS组为76 (IQR, 41-90), FN组为89 (IQR, 81-95) (P = 0.005)。侵袭性肿瘤(62分[IQR, 39-88分])的中位AI评分高于非侵袭性肿瘤(33分[IQR, 20-55分]);P < 0.01),高级别(2-3级)肿瘤62例[IQR, 40-87],低级别(0-1级)肿瘤45例[IQR, 26-81];P =0 .02)。在96%的特异性阈值下,AI算法标记了514例IC中的121例(23.5%),并在121例(76.9%)中正确定位了93例IC,在IC的乳腺钼靶图像上有48张FP热图(比率,0.093 /例),在正常乳腺钼靶图像上有74张FP热图(比率,0.048 /例)。AI算法正确定位的TN IC比例较低(427个中有54个;12.6%)高于IC合并MS(76人中有35人;46%)和FN IC(8个中的4个;50% [95% ci: 13, 88];P < 0.001)。AI算法对节点阳性肿瘤的定位比例高于节点阴性肿瘤(P = 0.03)。然而,没有证据表明癌症类型(P = 0.09)、分级(P = 0.27)或激素受体状态(P = 0.12)有差异。在89.8%的特异性和79%的敏感性阈值下,AI检测分别增加到514例IC中的181例(35.2%)和256例(49.8%),而FP热图在1548例正常乳腺钼靶中分别为158例(10.2%)和307例(19.8%)。


表 使用96%或89.8%特异性阈值筛查钼靶图像的AI热图准确性的描述性统计

本项研究表明,使用独立的AI系统可以正确识别一些被两个阅读者遗漏的癌症,从而提高早期癌症的检测;其中,除了淋巴结阳性的癌症外,基于组织病理学特征没有差异。

原味出处:

Muzna Nanaa,Vaishnavi O Gupta,Sarah E Hickman,et al.Accuracy of an Artificial Intelligence System for Interval Breast Cancer Detection at Screening Mammography.DOI:10.1148/radiol.232303

爱去舞 人体艺术 妇科学问

下篇:Stroke:生命基本8要素轨迹和中风风险——一项前瞻性队列研究

上篇:Radiology:场循环MRI识别轻度缺血性卒中的能力及价值 

首页 > 医疗学术
闽ICP备17012959号