真正的颠覆式创新,不只是技术上的颠覆。
作者|刘杨楠
编辑|栗子
1月22日,北京赛尔大厦。在距离Baichuan-M3模型发布仅仅九天后,百川智能创始人、CEO王小川再次坐到了媒体面前。
这一次,百川带来了新一代模型Baichuan-M3 Plus,其在严肃医疗场景下的问答准确性、可靠性,再次刷新了M3所创下的世界纪录。
凭借百川独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,低于Open Evidence。
同时,百川首创“证据锚定”技术,不仅给出引文来源,还能将模型生成的每一句医学结论,精确锚定到原始论文中的对应证据段落,使AI的医学判断真正做到可核验、可追责、可教学。
更具长期意义的是,百川宣布推出「海纳百川」计划,将全球最低幻觉的循证增强医疗大模型以API形式,免费开放给中国医疗服务机构,让每一位中国医务工作者都能拥有可靠、好用的AI助手。
在当前大模型发布已趋于“常态化”的今天,这种高频迭代已经不是单纯技术宣发。在今天上午的媒体沟通会上,百川智能创始人、CEO王小川与模型技术负责人鞠强所言均指向一个核心判断:
AI已经具备进入严肃医疗核心流程的技术条件,但行业仍然卡在“信任”与“共识”这两道最后的门槛上。
因此,百川近期的密集动作,更像是一场针对中国AI医疗规模化落地的主动加速。这背后,则关乎一场面向中国医疗行业的非典型性“颠覆式创新”。
1.为“严肃医疗”量身定制的模型
与模型能力的快速演进形成鲜明对比的,是中国医生群体的真实使用状况。
某种程度上,医生的规模化使用,是AI在医疗行业真正落地的最后一公里。没有医生的广泛参与,AI再强,也只能停留在科研演示、辅助搜索或零散试点阶段,无法真正改变医疗系统的运行效率与供给结构。
在美国,已有超过45%的医生在日常工作中使用 OpenEvidence等AI工具;在国内,国家层面也大力推动“AI+医疗”试点建设,已有上千家医院引入各类AI系统,患者与普通用户对通用大模型的使用也在快速普及。
然而,在临床一线,许多中国医生依然处于一种谨慎的观望状态。他们知道AI很重要,也看到患者已经在用,但自己“不敢用、不会用”。
这种迟疑,一方面,源于医疗行业对风险的天然敏感。诊疗决策对错误的“0”容忍,以及中国医疗系统自身的权威性,使得医生对任何“不可解释、不够可控”的工具,都保持本能的谨慎。
另一方面,则源于中美两国医疗供需结构的不同。在王小川看来,中美医生的工作环境完全不一样。美国医生一天可能看十个病人,是预约制,有时间慢慢用 AI;中国医生一天要看上百个病人,每个患者只有三五分钟,这种情况下用 AI,本身就难得多。
另外,中国在真实表达进展这件事上成本很高,甚至有很多不太严肃的评价,比如“xx完败xx”等噱头式的表达。“如果行业不能更真实、更良性地竞争,而是继续靠‘皇帝的新衣’,那AI落地医疗行业的速度只会被拖慢。”王小川说。
从这个意义上看,AI落地医疗行业的真正瓶颈,已经不单纯在于“模型是否足够强”,而在于是否足够可信,是否足够可核验,是否能被纳入医生的专业判断体系之中。
百川 M3 Plus此次的三项更新,便围绕这个目标展开,即用通过不断增强模型的可靠性, 降低模型幻觉,来降低医生使用AI的心理与制度门槛。
第一,是在基础模型层面压制医学幻觉。
M3 Plus将百川自研的Fact-Aware RL强化学习范式与“六源循证”体系结合,在无工具或弱工具场景下,仍然将幻觉率压至行业新低。这种做法的核心逻辑,是将“事实一致性”作为模型内生目标,而不是完全依赖外部工具兜底。
第二,是提高引用准确率,以换取医生信任的底线。
在临床场景中,“是否给出引用”已经不是关键,关键在于引用是否真的支持结论。百川M3 Plus首创“证据锚定(Evidence Anchoring)”技术,不是简单标注“引用自哪篇文献”,而是要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。每一句判断,都能被逐字溯源、逐条核验。
为实现这一目标,百川将引用准确性作为独立训练目标,引入Citation Reward Model,对错误或不匹配的引用进行明确惩罚,使结论与证据段落的匹配准确率提升至 95%。这意味着,AI 不只是“看起来专业”,而是能够被逐句核验。
第三,是持续降本,打穿规模化门槛。
通过MoE架构优化、模型量化与Gated Eagle-3投机解码等工程手段,M3 Plus的API调用成本较上一代下降约70%。在医疗这样高频、长链路的使用场景中,成本并非商业问题,而是决定是否能被规模化部署的前置条件。
同时,百川全面开放M3 Plus的技术能力,API限时免费体验15天,所有开发者均可申请使用。
综合来看,百川通过三项创新,实则在为“严肃医疗”场景重新定义一套可被信任、可被规模化使用的模型标准。
2.Baichuan-M3 Plus能改变什么?
从AI医疗影像时代开始,医疗AI发展的核心阻碍有二:一是信任,二是共识。因此,大模型时代要真正加速医疗AI发展,也需从这两个方面入手。
首先是信任体系的重塑。
在传统大模型范式中,模型基于概率计算,能够生成流畅、合理的回答,但对其内部推理与证据来源,往往具有很强随机性,使用者往往无法真正核验。
在普通场景中,这种不透明或许只是体验问题;但在医疗场景中,这直接构成安全风险的底线问题。
百川在 M3 Plus 中强调的“证据锚定”,本质上是在试图把AI从基于概率预测的黑盒,转变为基于循证推理的白盒。
每一条医学结论,都需要被精确锚定到原始论文、指南或说明书中的具体段落。这种机制,使AI的判断第一次具备了接近临床医生工作方式的可靠性,也为医生保留了最终判断权。
在张文宏等一线医生表达对AI影响决策准确性的担忧时,真正的分歧点在于,当AI给出建议时,医生能否清楚知道“它为什么这么说”。
从这个意义上看,证据锚定能力给“医疗AI能否被纳入临床决策体系”这一问题划出一道边界。
第二个关键,是推动行业共识的形成。
过去几年,中国AI医疗的发展,呈现出明显的碎片化特征。各家医院做各自的系统,厂商提供定制化方案,缺乏一个被广泛认可、可复用的技术底座。这导致大量项目停留在“示范工程”,难以形成规模效应。
百川此次通过“海纳百川”计划,将M3 Plus以API形式免费开放给服务医务工作者的机构,试图推动行业形成事实上的技术共识。
沟通会上,王小川预计,假设全国500万医学工作者都加入“海纳百川”计划,每年形成的成本约1亿元。“我们认为这种成本是可接受的,给行业带来的变化将非常大。”
事实上,当足够多的开发者、医院与服务机构围绕同一能力底座构建应用时,AI才有可能从零散工具,演化为医疗领域行业级的基础设施。对百川而言,这也是一种更接近平台化,而非单点产品的策略选择。
在实际开发、应用过程中,“信任”与“共识”这两条底线自然被拉齐,AI才可能真正进入医生的日常工作流,缓解国内医疗供给紧张的现状。
因此,M3 Plus实则是百川针对医疗行业结构性瓶颈,在技术层面给出的方案。这也构成了百川智能这场“颠覆式创新“的核心基础。
3.百川想改变什么?
如果将百川在医疗领域的长期逻辑抽象出来,其关键词就是——增加好医生的供给。
在互联网时代,医疗从来不是一门容易规模化的“好生意”,其核心约束并非流量获取的难易,而是医生资源本身。医生培养周期长、供给弹性低、地域分布不均,这些结构性问题,长期限制着医疗服务的普惠。
AI的出现,第一次让医生借助技术在数字世界“增加医生供给”成为可能。
通过将专家级知识、循证能力与推理能力嵌入模型,使更多年轻医生、基层医生获得接近高水平专家的决策支持。
王小川进一步解释道,今天年轻医生使用AI的方式需要调整,不是要求医生给AI纠错,而是反过来,让AI对医生的临床思维误区进行提醒,也给诊疗结果进行校验,这样才有机会降低误诊、漏诊风险。“不是医生给AI挑错,而是AI给医生保驾护航。在这种情况下,医生成长了,患者也受益了。”王小川说。
在此前提下,百川通过主动降本与开放API等技术让渡,让原本只可能在头部医院、头部专家身上集中体现的能力,有可能被复制,本质上是在扩展优质医疗能力的有效供给。
从这个层面看,百川正在医疗行业发起某种非典型性的“颠覆式创新”。
克莱顿·克里斯坦森曾对颠覆式创新给出明确定义,颠覆式创新是指在一个新的价值网络中,出现一种新的商业模式,从而导致原有成熟市场的突然崩溃。
但百川发起的这场关乎AI医疗的颠覆式创新,并不具有“破坏性”,反而是对原有价值体系的赋能,将真正专业、可靠的医疗模型嵌入医疗流程的核心决策环节,成为医生能力的放大器。
这种“放大”,一方面体现在医疗效率提升,缓和医疗资源挤兑的现状,另一方面在于系统性增强医疗行业的风险控制与知识更新能力。
在媒体沟通会上,王小川多次强调一个观点:如果AI能够在某些场景下显著提升患者获益,但却因为担心阻碍“医生成长”而限制使用AI,可能就限制了最有利于病人的医疗措施。
由此也折射出百川在AI医疗赛道中秉持的关键判断,即技术进步与医生职业发展,并非零和博弈,而是可以通过恰当的使用方式,实现双赢,并最终让广大患者从中受益。
也正是在这样的长期判断下,百川近期表现出的“紧迫感”,才显得更容易理解。
如果说上一阶段,行业还在讨论“AI能不能用于医疗”;那么这一阶段,讨论的核心已经转向“谁能够定义AI在医疗中的使用方式与信任边界”。
密集发布、快速迭代、主动降价与免费开放,百川在抢占一个时间窗口,在技术Ready,医疗AI从小规模试点真正走向规模化的关键转折期,率先建立技术标准与生态基础。
当然,这只是AI赋能医疗的第一步。责任边界、制度适配、医生培训、使用规范,仍将是下一阶段更为复杂的挑战。而这远非百川一家所能完成的。
但至少,从M3 Plus这一轮发布可以看出,以王小川为代表的一部分创业者已经不再满足于“做出更强的模型”,而在尝试回答一个更难的问题——如何让技术真正成为医疗系统的一部分,而不仅是系统之外的工具。
这或许才是百川近期加速背后,更值得被长期观察的变量。