「粉红杀手」通缉令,AI 阅读乳腺 X 光片的能力已与医生相当

2023-09-22 13:09:39

据世界卫生组织统计,2020 年全球新发乳腺癌病例 230 万例,在所有癌症中居首位,超越肺癌成为第一大癌。
然而,如果能够早期发现并加以及时治疗,在肿瘤转移之前杀死癌细胞,乳腺癌的致死率就可以大大降低。目前乳腺癌初筛的常用手段是乳腺 X
光,随后医生通过分析复核 X 光片对乳腺健康情况进行判断。但复核过程会消耗大量时间,影响其他患者的就诊。
为此,英国诺丁汉大学的研究者对比了商用 AI 与医生阅读乳腺 X 光片的能力,为 AI 在临床医疗的应用提供了新思路。

作者 | 雪菜
编辑 | 三羊、铁塔
本文首发于 HyperAI 超神经微信公众平台~

据美国癌症协会统计,2022 年美国女性新发癌症病例数约 93 万例,其中新增乳腺癌患者约 29 万人,占比 31%。同时,癌症死亡病例中乳腺癌患者占比 15%,仅次于肺癌。
在这里插入图片描述

图 1:美国 2022 年新发癌症病例数(上)及癌症死亡数(下)

在中国,乳腺癌是 21 世纪女性患者中占比最高的癌症,且每年新增患者数量在不断增加。
在这里插入图片描述

图 2:2000-2016 年我国女性新增癌症病例数,灰色为乳腺癌病例数

乳腺癌是异常乳腺细胞生长失控并形成肿瘤引起的疾病。如果不及时干涉,肿瘤会转移扩散,最终危及性命。但如果能在癌症初期发现局部肿瘤,并开始治疗,癌症的五年存活率可达 99%。

目前,医院一般通过乳腺 X 光进行乳腺癌初筛。然而,在初筛过程中可能会出现假阳性,使得没有癌症的患者进行不必要的检测。还会出现遗漏,延误患者最佳治疗时间。

因此,许多欧洲国家会对乳腺 X 光片进行复查,尽可能排除掉假阳性的病例。这一方法行之有效,在降低假阳性的同时,还将癌症的检测率提高了 6%-15%。

但是,对 X 光片进行阅读评估需要耗费相当的时间。 在医患比偏低的地区,X 光片的复查不仅占用了医生的时间,而且会影响到其他患者的早期筛查。

AI 的应用部分缓解了医生的工作压力,然而将生命健康交给 AI 去评价似乎有些不太稳妥。 对此,英国诺丁汉大学的 Yan Chen 教授表示,「将 AI 应用于临床医疗面临着很大的压力,但我们需要将这件事做好,以保护女性的健康」。

为此,Yan Chen 团队对比了商用 AI Lunit 与医生阅读乳腺 X 光片的准确率。结果显示,Lunit 分析乳腺 X 光片的能力与人类医师相当。 这一成果已发表于「Radiology」。
在这里插入图片描述

论文链接:

https://pubs.rsna.org/doi/10.1148/radiol.223299#_i13

实验过程

数据集:PERFORMS 数据集

本研究选用两组 PERFORMS 数据集作为模型的测试集。每组 PERFORMS 数据集由 60 张具有挑战性的 X 光片组成,包括恶性肿瘤 (约占 35%)、良性肿瘤和正常结果。过去 30 年间,PERFORMS 数据集用于英国国家卫生服务乳腺筛查计划 (NHSBSP) 医生的入门测试和常规考核。

评价标准:标注 + 评分

在对 X 光片进行分析时,医生会在可疑的位置做出标注,最后做出 1-5 的评级,对应正常、良性、不确定、可疑及恶性。

AI 会对 X 光片的各个特征的可疑程度进行 1-100 的评分,最高分视为对整个 X 光片的评分。如果没有可疑特征,则视为 0 分。
在这里插入图片描述

图 3:医生与 AI 对乳腺 X 光片的分析结果

A:蓝色箭头为直径 8 mm 的不明肿块,后鉴定为组织学 2 级导管癌;

B:红色十字是 AI 发现的异常特征,蓝点是医生在分析时标注出的可疑区域。

对比结果:特异性 + 灵敏度

共有 552 名医生参与了这场比赛,占 NHSBSP 总人数的 68%,其中有 315 名放射科医生、206 名放射技师和 31 名临床医生。

在对两组 PERFORMS 数据集进行分析后,他们认为 161 个乳腺 X 光片结果是正常的,70 个乳腺中有恶性肿瘤,还有 9 个为良性肿瘤。恶性肿瘤的常见特征包括肿块 (64.3%)、钙化 (12.9%)、不对称 (11.4%) 和结构扭曲 (11.4%),平均病变大小为 15.5 ± 9.2 mm。
在这里插入图片描述

表 1:PERFORMS 数据集结果

人类组的平均 AUC 为 0.88。AI 组的 AUC 为 0.93,对应人类组 96.8 百分位数,但两组的 AUC 没有明显差异。
在这里插入图片描述

图 4:医生组 AUC 直方图与 AI 的 AUC(黄线)

人类组的平均灵敏度和特异性分别为 90% 和 76%。在开发者推荐的阈值下,AI 的敏感性和特异性分别为 84% 和 89%。
在这里插入图片描述

表 2:医生组与不同阈值 AI 的判断结果

TP:真阳性;

FP:假阳性;

TN:真阴性;

FN:假阴性;

灵敏度 = TP / 总阳性数;

特异性 = TN / 总阴性数。

在 AI 的 ROC 曲线中,52% 的医生表现在曲线之上,36% 在曲线下方,12% 的表现与 ROC 曲线一致。
在这里插入图片描述

图 5:AI 的 ROC 曲线,其中蓝点是不同医生的表现

当 AI 的阈值为 3.06 时,AI 的灵敏度与医生一致,检测出了 63 例恶性肿瘤,仅遗漏了 7 例。此时 AI 的特异性与医生没有显著差异。

当阈值设置为 2.91 时,AI 与医生组的特异性一致,灵敏度为 91%。上述结果显示,Lunit 的 AI 分析乳腺 X 光片的灵敏度和特异性与人类医生相当。
在这里插入图片描述

图 6:不同阈值对 AI 判断结果的影响

A:蓝色箭头为不对称区域,后鉴定为组织学 2 级导管癌;

B:AI 阈值为 2.91 时的检测结果,红色十字最终鉴定为真阳性;

C:AI 阈值为 3.06 时的检测结果,没有发现明显异常特征。

Yan Chen 教授表示,「这一研究的结果为 AI 筛查提供了有力证据,说明 AI 对乳腺 X 光片的分析水平与人类医生相当」。

乳腺癌:隐匿的粉红杀手

2021 年 2 月 4 日世界癌症日上,世界卫生组织 (WHO) 属下的国际癌症研究所称,上一年新增 230 万例乳腺癌病例,占比 11.7%,首次超过了肺癌新增病例数,俨然成为「隐匿的粉红杀手」。

同时,乳腺癌发病率最高的群体是高收入国家的妇女,中低收入国家的女性发病率明显更低。而且,还有约 0.5-1% 的乳腺癌来自于男性。

不过,乳腺癌本身的致死率并不高。 2016-2020 年诊断出乳腺癌并存活的女性达 800 万人,高于其他癌症。

目前 WHO 正在全世界推广全球乳腺癌行动,希望通过早发现、及时诊断和全面的乳腺癌管理来降低全球因乳腺癌死亡的人数。
在这里插入图片描述

图 7:AI 辅助的乳腺癌筛查

作为乳腺癌初筛的有力工具,AI 能够及时发现乳腺癌早期的特征,有望将「粉红杀手」扼杀于预备阶段。但现在大规模在临床中推广 AI 可能为时过早,因为环境和算法本身的变化会不断影响,导致 AI 的灵敏度和特异性随时间而下降。

Yan Chen 教授也认为,「一旦 AI 进入临床应用,我们就必须有一个机制对其进行持续的评价和监测」。现在,世界各国的研究团队正在对 AI 的检测结果进行评价,已经取得了令人满意的结果。未来在高效的 AI 和完善的监管机制的帮助下,各类疾病将「无处可藏」,我们的健康将得到更稳定的保障。

参考链接:

[1]https://acsjournals.onlinelibrary.wiley.com/doi/10.3322/caac.21708

[2]https://www.sciencedirect.com/science/article/pii/S2667005422000047

本文首发于 HyperAI 超神经微信公众平台~

更多推荐

「计算机知识随记」Unicode 与 UTF-8 和仍然存在的乱码问题

0背景中文维基百科对Unicode的定义是:如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,那么乱码问题就会消失。这就是Unicode,就像它的名字都表示的,这是一种所有符号的编码。可是在Unicode已经发布的(Unicode1991年发布,UTF-8是1993年初发布)三十年中,编

九、性能测试之网络测试

性能测试之网络测试一、网络知识二、判断带宽是否有问题1)查看本机带宽:1、ping目标服务器2、查看网卡三、网络调优实战:当接口报地址被占用/连接超时原因1:是源端口不够用解决方案:1、我们尝试去掉keep-alive,发现没有根本解决问题,只是把报错时间延后2、在windows和linux解决源端口的问题1)wind

开启海外“新副本”,中旭未来有几道“关卡”要闯?

随着游戏版号逐渐恢复正常发行,我国游戏市场重回增长快车道,行业景气度也逐步回升。伽马数据显示,2023年1-6月,中国自主研发游戏国内市场实际销售收入1217.84亿元,环比增长24.53%。近期,凭一句“我是渣渣辉,是兄弟就来砍我”走红全网的“贪玩蓝月”系列游戏迎来好消息,其母公司广州中旭未来科技有限公司(以下简称“

iMovie for Mac v10.3.9(视频剪辑)

iMovie是一款视频剪辑软件,广泛应用于Mac和iOS设备。以下是关于iMovie软件的一些推荐信息:简单易用。iMovie的设计简洁,操作简单,即使是没有剪辑经验的新手也可以轻松上手。软件内置了丰富的视觉效果、滤镜、绿幕抠图、分屏和画中画功能,可以满足用户的基本需求。高质量音频编辑工具。iMovie具有强大的音频编

nlp自然语言处理

NLPnlp自然语言处理(不一定是文本,图形也可以)接入深度学习(向量处理),需要把文字等内容转换成向量输入深度学习分为有监督和无监督学习两类,对应分类和生成算法都是向量输入词嵌入(映射到向量)词嵌入最简单的模型是one-hot,但数据计算量太大,所以后续更多的是减少数据量和建立关联性one-hot,最简单分类(单位矩

5G技术与教育的融合:挑战与机遇

5G技术与教育的融合:挑战与机遇摘要:本文旨在探讨5G技术在教育领域的应用及其对教育产业的潜在影响。首先,我们将简要介绍5G技术和现代教育技术的背景和现状。接着,我们将详细讲解5G技术在教育领域的应用,包括教学场景、互动模式和教育内容等方面,并通过实际案例进行分析。随后,我们将对5G技术在教育中的优缺点进行深入探讨,提

解锁前端Vue3宝藏级资料 第五章 Vue 组件应用 1( Props )

本章带领大家理解组件、props、emits、slots、providers/injects,Vue插件等Vue组件使用的基础知识。5.1组件注册5.2Props5.2.1组件之间如何传值5.2.2参数绑定v-bind5.2.3参数类型5.2.4props默认与必填5.2.5验证设置5.2.6useAttrs属性设置第

大数据名词——MPP(Massively Parallel Processing)数据集市

MPP(MassivelyParallelProcessing)数据集市是指一种基于大规模并行处理的数据存储和分析平台,旨在支持高效的数据处理和查询。MPP数据集市通常由多个节点组成,每个节点都具备计算和存储能力,并且可以同时处理大量的数据。MPP数据集市的主要特点包括以下几个方面:1.并行处理能力:MPP数据集市使用

知识产权之围:跨境电商卖家的法律防线

在当今数字化全球市场中,跨境电商是企业扩大国际业务的重要途径。然而,随着全球贸易的复杂化,知识产权问题已成为跨境电商卖家必须面对的挑战之一。本文将通过一个具体案例来探讨知识产权的重要性以及跨境电商卖家如何建立法律防线来保护自己的创意和品牌。Sophia'sBoutique的知识产权之困Sophia是一位富有创造力的跨境

Springboot项目升级2.2.x升至2.7.x

依赖管理spring-boot-starter-parent升级为2.7.1<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><!--升级为2.7.x的版本--><v

压力测试:Jmeter自动化测试详解

1、Jmeter的安装与部署1.1环境要求jdk1.8、配置jdk环境变量(JAVA_HOME:C:\ProgramFiles\Java\jdk1.8.0_101Path:;%JAVA_HOME%\bin;CLASSPATH:%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar)1.2安装

热文推荐