AI医疗影像:在数据“围城”中如何突围
创始人
2025-12-08 21:21:16

数智之道

刘劲、段磊、李嘉欣/文

近日,国家卫生健康委办公厅等五部门发布《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》,提出“人工智能+医疗卫生”发展的时间表:到2030年,基层诊疗智能辅助应用基本实现全覆盖,推动实现二级以上医院普遍开展医学影像智能辅助诊断、临床诊疗智能辅助决策等人工智能技术应用,“人工智能+医疗卫生”应用标准规范体系基本完善,建成一批全球领先的科技创新和人才培养基地。

当前,中国的医疗影像智能化建设确实正在提速,推广医学影像智能诊断服务,为提升基层医疗服务能力提供新路径。

医疗影像(X光片、CT、MRI、超声等)指利用各种成像技术,将人体内部的结构或组织以可视化的形式呈现出来,对疾病的诊断、治疗和监测起到重要的作用。

由于医疗影像的数字化起步较早,数据结构相对标准化,便于计算机视觉处理,早在90年代,业界便开始尝试将医疗影像与计算机辅助诊断相结合;后来,以卷积神经网络(CNN)为代表的深度学习技术在图像识别领域取得巨大突破。自2017年左右起,AI技术与医疗影像的研究、临床试验和实际应用开始快速发展,成为AI技术在各行业中最早实现规模化落地的场景之一。

目前,AI医疗影像产业的辅助诊断技术已较为成熟,步入实际落地应用阶段,头部三甲医院几乎都引入了AI医疗影像产品。

AI为医疗影像的价值

AI技术已为医疗影像领域带来巨大价值。

我国影像科医师严重短缺,尤其是在繁忙的三级医院。根据我们的访谈,三级医院每位影像科医生日均需出具80—100份CT报告、60—80份磁共振报告或120—150个超声检查,超负荷工作现象普遍。

在传统模式下,医生需审阅大量影像图片,从中找出并标注病灶的大小、形态、位置,再结合多方信息完成一份诊断,通常耗时近30分钟。而在AI辅助下,病灶识别和定量标注等耗时环节被大幅自动化,整个诊断流程可缩短至5—10分钟,显著提升了医生的工作效率,尤其缓解了工作早已过饱和的三级医院医生的压力。

AI的应用已渗透到影像科多个主流检查项目中,如胸肺部的肺结节与肺炎识别、骨科的骨折检测与骨龄分析,以及乳腺的病灶辅助检测等;在放疗、手术等治疗场景中也得到广泛应用。在影像检查项目中,AI的核心作用在于自动识别并标注病灶,辅助医生诊断,其识别准确率普遍高达95%以上。在放疗的影像辅助上,基于AI的放疗靶区勾画、剂量计算和自适应放疗计划等,能够将几小时的医生治疗计划制定压缩至几分钟内完成;在外科手术中,用AI医疗影像技术辅助医生制定手术计划,以及在术中用定位和导航辅助实施手术也有了不错的进展。

正是基于这种“又快又准”的价值,许多医院开始引入AI医疗影像产品,特别是在三级医院的影像科已实现比较规模化的应用。粗略估算,全国三级医院合计约有14万名影像科医生,平均工资约19万元,保守假设AI能为其节约一半工作时间,理论上每年可创造高达130多亿元的价值。

商业化困境

然而,巨大的价值创造并未转化为相应的商业回报。根据我们的测算,2020年至2024年整个行业的累计商业收入不足30亿元,平均每家医院终身使用一款AI医疗影像产品仅需40万元,且多为一次性的软件买断模式,后续服务收费乏力。行业陷入“叫好不叫座”的商业化困境,企业捕获的价值远低于其创造的价值。

主要原因是现阶段用于辅助的AI医疗影像产品技术门槛相对较低,同质化竞争激烈。

通常,使用几千例标注的医疗影像训练一组串联的“小模型”即可实现辅助功能,技术门槛和研发成本低,导致入局者众多。截至2025年,已有100余款AI医疗影像产品获批三类医疗器械注册证(NMPA),在“同台竞技”;单论胸肺一个场景,就有数坤、推想、深睿、联影、医准等十余家企业竞争。

激烈的竞争迫使厂商纷纷采用“免费试用”策略抢占医院入口,最终将整个行业拖入囚徒困境:只要一家免费,所有人都被迫跟进;而当医院习惯免费模式后,任何一家率先收费的厂商都可能被立即替换,导致市场份额丧失。

此外,医院的经费限制也导致AI医疗影像产品可销售市场进一步收窄。由于现阶段AI产品的功能还停留在辅助诊断阶段,未提供超出医生水平的增量功能,医保和患者缺乏付费使用AI的动力,主要靠院方甚至科室的经费购买AI医疗影像产品。

然而,除头部三甲医院外,其他医院能够用于购买软件的经费金额很有限,不少三乙和二级医院全年检查收入在百万量级,很多影像科自身处于亏损状态,即使是购买刚需的、售价在几十到百万元的CT硬件设备都经费吃紧,更不用提负担非刚需的数十万元的软件费用,导致AI影像产品的市场天花板被进一步压缩。

激烈竞争下,现有AI医疗影像企业盈利十分困难。以AI眼底影像头部企业鹰瞳科技为例,2024年全年收入1.5亿元,但销售费用占近一半,考虑其他运营和财务费用,2024年亏损2.6亿元,盈利情况堪忧。大部分非头部企业的年收入仅在千万元量级,难以覆盖高昂的研发开支,长期依赖融资资金维持。这并非个案,而是同质化竞争下全行业困局的一个缩影。

“AI+医疗影像”的更大潜力

这种困局是可能被改变的,这要求AI技术在医疗影像分析、疾病诊断、治疗、监测等方面带来更大价值,也对应着更高的研发门槛和竞争壁垒。

目前,AI仍只能提供辅助诊断价值,诊疗上的准确性仍存在不足。具体来说,在检查方面,目前AI在第一步“找出病灶”方面表现出色,甚至比人类更全面(漏检率低);但在第二步“判断疾病良恶性质”上的表现还不够令人满意(误诊率高于优秀人类医生)。在治疗(化疗和手术等)辅助方面,AI辅助可大幅提高医生的准备效率,但计划仍需医生进行人工检查、复核才能确保质量;在术中可起到定位和导航的辅助作用,但治疗的实施主体仍是医生。这使得即便没有监管限制,其能力上限暂时只能作为医生的提效助手,难以取代医生。

要进一步提升其价值,需要更强的基础模型能力。现在医疗影像领域商业化模型依然以卷积神经网络(CNN)为主,其优势是对局部细节特征捕捉较好,但天然缺乏全局视野,“见木不见林”,容易对复杂的疾病影像产生误判。比如,在一张全身PET—CT扫描中,判断一个骨骼上的可疑点是原发性骨肿瘤还是肺癌的骨转移,需要将骨骼病灶和远处的肺部信息关联起来,这种能力是以CNN为基础模型的AI所不具备的,优秀的医生显然可以做到。此外,CNN对三维影像的理解能力也比较弱。

业界已意识到引入Transformer可大幅提升AI医疗影像能力的上限。Transformer最初为自然语言处理(NLP)而生,是近两年疾速发展的大语言模型的底层基础,其核心武器是自注意力机制(Self-Attention),擅长全局结构和长距离依赖的分析,这恰好能弥补CNN的短板。

在上述案例中,骨骼上的可疑点可通过注意力机制,直接与远处的肺部结节建立强关联,从而为“肺癌骨转移”这一诊断提供强有力的证据。这种提升让AI从“辅助诊断”向“独立诊断”更进一步。

除了影像分析本身的上限提升,引入Transformer有望令AI从影像切入,但不止于影像,而是跃升为处理多维度医疗信息的临床综合大模型,这个上限由Transformer的多模态能力打开。

理论上,通过Transformer处理多模态数据的能力,我们可以把一个病人的影像数据(CT、MRI、X光、病理切片)、文本数据(病史、主诉、既往检查报告)、检查数据(血液、尿液)、时序数据(心电图、脑电图)、组学数据(基因、蛋白质组)都给到AI,将AI从“单兵作战”(纯影像)推向“全域决策”,它打破了不同医疗数据形态之间的壁垒,为构建一个覆盖从筛查、诊断、手术规划到术后随访全流程的真正的、综合性的临床诊疗大模型铺平了道路,实现诊断、治疗与管理环节的协同。

难点和机会在于数据

从基于CNN到基于Transformer的AI医疗影像范式转移,从单一模态的影像辅助分析到多模态的综合诊疗模型转换路径似乎是清晰而令人鼓舞的。学术界近年确实有大量基于Vi-sionTransformer(ViT)、SwinTrans-former、CNN-Transformer混合的论文在RSNA、MICCAI等顶级会议上发表,任务涵盖肿瘤检测、器官分割、病灶分类、跨模态检索等,在很多基准测试中也取得了超过CNN模型的成绩。

但研究热度与商业落地之间存在巨大鸿沟,还很少有基于Transformer的成功AI医疗影像应用出现,更不用说多模态综合诊疗模型。

这里面有很多原因,包括医疗领域天然的保守和风险厌恶属性,对新技术的审批要求严苛,CNN辅助诊断软件已有 FDA、NMPA批准的案例,而Transformer多模态模型属于更复杂、更不透明的模型,解释性更弱,更难过审。并且,以Transformer为基础的技术路线还在快速迭代中,企业对投入长周期认证一个“可能过时”的架构会心存疑虑。计算成本与部署挑战,Transformer模型通常参数量更大,计算复杂度更高,尤其是在处理高分辨率3D医疗影像时,对GPU计算和存储能力的要求极高;医院的IT系统庞大而复杂(PACS、RIS、EMR等),Transformer模型的复杂性可能导致集成更困难。此外,大部分厂商和医院已经围绕CNN构建了工具、人才、适配等生态,生态颠覆需要足够大的价值提升才能推动各方下定决心转换。

但在巨大的潜力面前,长期看算力、生态、监管都并非最大的挑战,因为它们可以通过技术进步、市场演化和政策调整来解决。我们认为,阻碍AI医疗影像向前发展的最大、最紧迫的挑战是数据,最大的机遇也蕴藏在数据之中。

VisionTransformer如果从头训练,需要百万到千万级的图像数据,在医疗领域的微调一般也需要十万到百万级的标注数据,这比现在主流商用医疗影像模型的训练规模大了几个数量级。而医疗数据涉及个人健康信息,受HIPAA(美国)、GDPR(欧盟)、中国个人信息保护法等严格法规的保护,数据共享和流通受到极大限制,这对准备训练数据带来了巨大挑战。

很多种疾病的可得数据还要小于这个量级,比如葡萄膜黑色素瘤每年全球病例几万例,有些罕见病更是只有几百上千例。即便对于大病种,如肺癌每年全球发病几百万例,获取大规模高质量的标注数据也很困难。如何获得众多医疗机构的同意拿到影像数据,如何克服不同设备由于扫描协议、参数、重建算法差异等带来的数据混乱,如何解决由于医生经验差异带来标注质量参差不齐,这些数据问题都对新技术的应用带来巨大的挑战。

多模态数据融合的美好愿景,又令数据问题的难度指数级上升。

首先,多模态模型训练不仅要求标注好的影像数据,还要求收集和处理多维度的数据:病理的标注、临床数据的整理、基因数据的注释等,新增巨大的工作量。而不同模态的数据对齐是更复杂的挑战,将这些来自不同时间、不同来源的数据进行精确对齐和配对,这无疑是一项浩大的数据工程。

医疗影像是人工智能较早赋能的领域,带来了很大的价值。但现在,“数据墙”成为阻碍人工智能在医疗影像乃至综合诊疗方面发挥更大价值的核心瓶颈。因此,能够在医疗数据的收集、治理、标准化、标注、隐私保护和高效利用方面建立核心能力的企业,将有望构建最深的护城河,引领下一代医疗AI的发展。

从全局来看,数据问题首先是一个技术问题,可以通过以下途径缓解:发展自监督学习减少对标注数据的依赖;部署联邦学习,在数据不出机构的前提下,多个机构共同训练一个模型,减轻数据孤岛限制;探索以合成数据降低罕见病数据不足的困扰等。

数据问题又远不只是技术问题,涉及到组织协调、利益博弈、信任机制、法律合规,在非技术的层面最重要的是设计或形成一种有效的协调机制,让数据流动起来发挥AI模型训练的价值。

逻辑上有两种途径:一是通过市场化的方式,二是通过自上而下的制度设计。哪种方式更好,还要通过更多的研究搞清楚。但中国可能在第二种方式上有制度优势,我们可以探索通过制度设计,更高效地解决医疗领域的数据问题,从而令中国引领AI医疗的发展。

数据问题不只存在于医疗影像领域,厘清并解决医疗影像领域的数据难题,不仅能推动医疗AI自身的革命性发展,也将为AI赋能其他各行各业提供宝贵的经验和范本。

(刘劲系大湾区人工智能应用研究院理事、特聘专家,长江商学院会计与金融学教授,段磊系大湾区人工智能应用研究院研究总监,李嘉欣系大湾区人工智能应用研究院研究员)

相关内容

热门资讯

四年耕耘 看渝中如何以“国字号... 当远在2000公里外的绿色电力点亮重庆的服务器,一场横跨渝新两地的算力协同正悄然改变产业生态;随着重...
分析教程!微信炸金花房间房卡怎... 炸金花是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:82606316许多玩家在游戏中会购买房卡来享...
工信部发布14个行业数字化转型... 新华社沈阳12月8日电12月8日在沈阳举行的2025年两化融合暨数字化转型大会上,工业和信息化部发布...
AI怎样改变我们的生活? 12月6日 以“科学·AI改变世界”为主题的 2025腾冲科学家论坛在云南腾冲开幕 当天下午,以“A...
大降价!苹果,转身之困! 苹果,最近有点忙。 12月6日上午10点,北京第6家、大中华区第59家Apple Store在北京大...