AI正在对医学成像领域深度渗透,这已是业内共识。
根据市场调查公司 Signify Research 报告,包括自动检测、量化、决策支持和诊断软件在内,全球医学影像 AI 市场在 2023 年将达到 20 亿美元。如今除了通用电气公司(GE)、西门子和谷歌等大公司,大量的新创公司正在涌入到这个领域来。
然而,很少有人能看清渗透将如何发生。
4月16日,一篇题为《医学影像 AI 路线图》的报告在业内顶级杂志《放射学杂志》上发布。这份攸关医学影像AI应用未来发展方向的路线图,理清了未来数年医学影像AI可能重点突破的技术主题,应为业内重点关注。它是2018年8月一次研讨会的成果,当时美国国立卫生研究院、北美放射学会 (RSNA)、美国放射学院 (ACR) 和放射学与生物医学成像研究学院在华盛顿特区联合主办这次会议。
路线图指出了五个关键主题:1.图像重建:如何从源数据生成适合解释的图像;2.图像自动标记和注释:从临床影像、电子档案和结构化图像中提取信息;3.临床影像机器学习新方法:包括定制的、预先训练的模型架构和分布式机器学习方法等;4.机器学习人工智能方法的解释性;5.图像识别和数据共享:以促进临床影像数据应用和学科发展。
如何解读这份路线图?这份路线图对于下一步的医学影像 AI 应用有多大的指导价值?为此专访了路线图作者之一、美国纽约伦斯勒理工学院讲席教授王革。
为什么放射医学更热衷 AI 应用?
王革:这和图像性质有关。在医院,成像技术会产生大量的图像数据,而图像数据分析正是 AI 相对成熟的技术。医学成像相当于是现代医学中的眼睛,可以把人的五脏六腑看得一清二楚。无论做手术,还是开药方,或者是放疗都离不开图像。所以人工智能介入进来理所应当,于是就变成了很热的一个领域。
此外,在医疗数据里边,断层扫描图像应该是最精确的数据了,因此利于 AI 研发。其他如电子病历或者是保险数据可能都会有较大误差,这也让医学影像领域在 AI 方面走得较快。不过那些不太精确的数据并非没用,如果这些数据分析和精确的图像数据结合起来分析,就会让医生有一个整合性的更精准的决策。
AI 在医学影像中的应用达到了什么阶段,是否还处于初级阶段呢?
王革:是的,还是初级阶段。比如说图像重建的问题,现在 AI 用在医学图像品质提升方面进展稍微快一些。比如说,对于一张模糊的医学影像,我们可以增强它的清晰度。原来用经典的 CT 影像分析方法可以将清晰度增强30%左右,现在我用深度学习分析CT图像或核磁共振图像,能增强100%甚至到200%。这个进步是显著的,但还需深入研究与严格检验。
图像增强对病患者是有实际收益的。比方说X光CT筛查癌症。因为大部分来体检的人是没有癌症的,在这个过程中人们会担忧X射线的安全性。因為X光照射本身可能会引发基因变异以及增加癌变的可能性。尽管这个可能性很小,但是毕竟让人们有所顾虑。在这种情况下,我们就考虑用比较少的X光剂量来做癌症筛查。问题是把剂量减少之后,就会得到背景嘈杂的影像。那么我们可以用机器学习来减少低剂量照射的噪音和伪影。也就是说,低剂量照射得到的原始图像是模糊的,有噪音的,经过机器学习处理这个图像就变得清楚了。这也是2018年8月NIH会议说的第一个要点,低剂量造影图像的重建。图像重建是机器学习的一个新领域。我们正在和GE合作研究基于AI的CT图像的重建。
另外,如何审批这类应用产品还没有明确规则。美国 FDA 正在考虑这个方向。AI研究结果看着很好,但要是用到病人身上,万一有失误怎么办?而且AI产品的监管和传统产品监管不一样,以前的产品的发布和修改是很明确的,但是AI产品是交互式的和自适应的,它会不断从现实环境中学习迭代,因此给 FDA监管带来新挑战。所以说,AI在医学影像中距离广泛应用还有工作要做。
在非医学图像数据库ImageNet大规模AI识别中,错误率已经低于人类的错误率。这是机器学习的结果,而错误率的降低对患者的健康至关重要。要知道,诊断错误造成了不少病患者死亡,而放射科医生的读片常有错误。在某些特定的图像识别中,现在人工智能已经超过人类了,将来机器一定程度上甚至是很大程度上会取代医生来读片,我认为这正在发生或迟早会发生。
AI 将来能全面取代医生吗?
王革:至少目前看我们还不能完全让机器来做复杂的处理,现在的AI还有可解释性、鲁棒性(即系统稳定性)等在医学影像领域尤其重要的问题需要解决。AI的介入希望能提高医生的诊治效率。我认为,最终这样的半自动化技术会在很多场景下变为全自动。也就是说,在一些特定场合取代医生是可以实现的。
一些很常规的分析,比方说骨头在X照射中看得很清楚。机器分析会明确诊断出有没有骨折。这种情况下,我觉得医生就可以相信机器。那么,医生的重要性怎么体现呢?在整个诊断过程中,将来医生的角色可能更宏观一些,进行一些有创造性、有想象力的分析。
你刚才说医学影像的AI发展还是初级阶段,那么路线图是如何描述下一个阶段要解决的问题的?
王革:这份路线图是行业专家告诉美国相关机构下一步要怎么走,侧重的是接下来几年要关注的要点以及可实现的改进,而不侧重AI的远景。
除了刚才说的图像重建问题,还有一个当前重要的问题是黑匣子问题,就是说机器学习的可解释性。医生可以和患者沟通病情、病因以及诊治的依据,但机器学习只会给出一个结论,这不容易让患者放心,会让人感觉把自己完全交给未知了。但这其实也是一个进步,以前患者只能听到医生的判断,现在患者还能听到AI的判断。我们现在正与IBM合作研究神经网络可解释性的问题。
另外一个问题是图像数据库。机器学习需要用大数据,来保证训练分析是合理的。还有外国的数据库拿到能不能用,要不要监管部门来审批,公司能不能开放数据,这都是问题。
再一个问题是硬件。机器学习用到大量的数据,所以对硬件的要求越来越高,尽管这几年硬件在快速升级,但对于普通机构可能就要负担不起。
还有,数据库会涉及病患者隐私,现在机器学习可能猜出患者的身份信息。对于隐私问题,我们可以借助于模拟计算来解决。比如用 10 个病人的图像,根据特征随机构造出一个新的患者(他不是这 10 个病人中的任何一个)。然后,我们用这个模拟患者来训练分析,这样就规避了数据隐私的问题。当然这个也会有弊端,它毕竟不是实际的病例,这就需要强大的数字模拟能力。
目前美国的医学影像数据库足够大了吗?还需要哪些完善措施?
王革:美国有一些公开的数据库,但更多数据库是不让别人用的。医院出于隐私的考虑很少开放其数据库。他们擔心病人的诉讼。如果要把病人的身份信息去掉,以及标注这些数据,要花大量的时间精力。
你怎么看待中国在这方面的研究?
王革:中国国内的应用研究很好,前景广阔。但源头创新比方说神经网的基础理论以及硬件芯片还是落后的,这方面定会进步。
你怎么看待美国FDA去年批准了AI在糖尿病视网膜病变中的应用?怎么看待医学AI商业化发展趋势?
王革:因为视网膜图像是两维的,相对比较简单,不像那种三维的甚至动态的图像分析那么复杂。另外糖尿病视网膜病变数据也比较丰富,又不是那么隐私敏感,所以这类应用已有很好的结果,甚至在智能手机上就能使用,很贴近老百姓。
我觉得发展都是从易到难。将来AI能不能精准地预测心脏病,预测中风以及癌症,就要一步一步来。我们和康奈尔大学在心脏疾病方面有些合作。
对于放射影像而言,放射科的主流机器都是由大公司来做。我们从两年前开始与 GE 合作人工智能成像方面的研究。而 IBM 侧重于大数据和推理,属于自然语言理解分析。有人说自然语言理解的进展没有图像领域进展大,但是我认为这事也不能急,时机成熟自然就会有好的结果。(摘自美《深科技》)(编辑/华生)