来源:蓝鲸TMT
AI正在重塑医疗行业版图。数据显示,2019-2023年,中国AI医疗市场规模从27亿元攀升至88亿元,年复合增速达34%。在AI医疗这片新兴市场,以华大基因为代表的公司扎根于基因测序,积极促进AI技术与基因检测、疾病诊断等业务深度交融,已建立领先市场的技术优势。
2025年2月7日,华大基因组织投资者关系活动,通过电话交流会的形式就公司在AI领域的布局进行了详细阐述,分享其在人工智能与生命科学融合方面的前沿探索与成果。
华大基因积极构建全球领先的多组学数据库,为AI模型的训练与优化提供了丰富的数据资源,通过开发的基因检测多模态大模型GeneT、ChatGeneT基因组咨询平台、智能化的疾病防控系统13311i,已占据了AI医疗龙头的地位。
模型技术持续创新,AI成果持续输出
自从大模型问世以来,医疗行业就是被视为最可能有丰富场景落地的一个行业。AI技术赋能医疗行业,一方面,降低原本高昂的医疗成本,减轻医保与患者的压力;另一方面,大模型的加持下,也让区域之间的医疗资源趋于平衡,让更多人享受到原本享受不到的高质量医疗资源。
目前,在基因检测等多个领域,华大基因的大模型等产品已成功走上临床应用的阶段,通过提升致病位点选择效率,大幅度降低了解读成本。华大基因的大模型技术有两大应用方向:一是基于 Transformer 等基础模型框架加速生物信息学分析及研究,二是利用开源大语言模型开展临床应用。
华大基因于2024年9月提出“生成式生物智能范式 GBI ALL (Generative Bio-Intelligent)”旨在通过智能科技的力量,精准洞察并高效应用生命数据,加速基因检测与健康管理的智能化进程,在该范式下包括用于全面智能化解读的基因检测多模态大模型GeneT(Genetic Transformer)、面向公众的基因组咨询平台 ChatGeneT等系统。
基因检测多模态大模型GeneT利用超过百万级的高质量数据,构建了百亿级的高质量token,结合解读专家经验,实现了对全基因组数据的精准解读,而ChatGeneT基因组咨询平台旨在拉近专业知识与公众之间的距离,通过智能化的咨询系统,为用户提供便捷、准确的基因组解读服务,普通用户可以上传自己的基因检测报告到ChatGeneT平台,通过对话方式了解相关疾病的遗传风险及预防建议。
此外,华大基因还与北京协和医院就罕见病大模型进行深度合作,致力于通过 AI 技术对未被诊断的患者进行重分析,挖掘潜在的基因突变共性。同时,结合基础医学研究和实验室验证来确保预测结果的准确性,能加速药物的研究。大模型的参数量大,能够结合多种遗传方式和多基因病检测有望为多基因病诊断带来显著收益。
这些成果为基因科技与AI技术的融合指明了方向,也是相关赛道探索的重要“里程碑”。
依托数据资产,巩固AI医疗竞争优势
尽管AI医疗这条赛道已有众多公司参与,但相比而言,华大基因的优势在于拥有全国产化的基因数据产出能力,基因检测过程能够自主、可靠地生成基因数据,成本可控。另外,在数据积累和数据分析上具有较大的先发优势,基于过去二十余年积累的数据及算法研发能力,使公司在通用模型基础上能够更好地结合专业知识,尤其在将多种健康管理检查数据融合并进行自动化、智能化分析方面,极大提升了检测效率,还通过上万个样本的实际验证,确保了极高的准确性以及稳定性。
同时,华大基因在交流会上还提到大规模的真实世界的数据来源多样性和真实案例库的全面性是将模型的准确率提升到临床级别可用的关键,其通过上万个样本的实际验证,确保了极高的准确性以及稳定性,在算法开发方面应用人工智能技术如提示词工程、微调强化学习和增强索引技术,通过结合增强索引(RAG)技术能更加充分且有效地使用华大基因积累的知识库和案例库,大大提升了模型的泛化能力和准确率。
在对外合作方面,华大基因通过与顶级医院的合作,构建了百万病例训练数据集,包含公开数据和商业合作数据,数据获取和预处理的高成本构成了较高的技术壁垒。华大基因通过信息化建设和数据对齐,确保数据结构化、来源可靠稳定以及对齐性,从而输出高质量数据。这种数据处理不仅满足了当前需求,也考虑了用户未来反复使用数据的需求,从而实现标准化,便于获取、存储和挖掘。可见,华大基因在AI医疗领域的竞争优势显著,使其在激烈的市场竞争中保持领先地位。
除此之外,华大基因在多个关键业务板块也让AI技术深度融入医疗领域强大的应用潜力不断浮现。
华大基因在过去几年中对肿瘤早期防控业务有良好布局和业务增长,通过不同组学最适宜的技术组合,去突破不同癌种早筛的防控模式,并致力于利用基因组、蛋白组和代谢组等多维度数据推动更有效的肿瘤早筛产品的开发和应用。在多癌早筛技术研发中,AI主要通过两个关键环节发挥作用:首先,利用多组学技术发现极微量的癌症信号;其次,能够准确判断信号来源位置,即溯源和定位。通过结合公共大模型与垂直领域数据训练,可以建立更经济且效果良好的模型,以降低参数拟合来获得较好的结果,并提高模型的特异性和准确性。
与此同时,华大基因勇立潮头,通过AI技术让医疗护航个人健康更加精准。在交流会有投资者提问,对于个性化诊疗,是否有可能每个人拥有自己的基因编码序列,以便针对自身诊断和个性化用药指导?华大基因的回复是全基因组信息是个性化诊疗的基础,它能提供药物反应、疾病风险预测、疾病预防及衰老相关指征等信息,个体化用药方面,华大基因已有成熟的业务应用,如用于肿瘤患者的个体化治疗,并正逐步拓展到疗效预测和预后判断。可见,AI技术有望通过分析病人的测试数据,为整个医疗产业的发展注入新的活力,推动医疗行业迈向新的高度。
推出“ALL计划”从生产型服务全面转向智能型服务
在华大基因看来,基因组学领域的工具自主可控导致的测序成本降低,正加速人人基因组时代的到来。面对海量基因组数据,如何高效精准地提取所需的基因信息以了解疾病进程,是一大亟待解决的问题。华大基因基于过往基因组数据与 AI 算法进行有效结合,有利于医疗机构与个体进行精准健康管理,加速精准医学的发展,助推生命科学的数智化进程。
在交流会上,华大基因提到未来将致力于打造核心的 AI 智能医疗体系,助力各业务板块转型升级。2025年将围绕“ALL 计划”的核心战略目标将业务模式从生产型服务全面转向智能型服务,推动前端样本处理自动化、智能化,并结合短读长和长读长测序技术平台,进一步提升数据库积累,为未来业务转型奠定坚实基础。
从更广阔的视角来看,随着测序成本的大幅下降和技术的不断进步,高深度全基因组数据在医学领域的应用前景愈发广阔。华大基因未来的商业模式也将顺应时代,结合本土化特色进行推广,打造多元化的商业模式,以适应不同国家和地区的需求,通过大规模临床验证,确保产品在真实世界中的表现和数据的准确性,进而勾勒基因蓝图,精准锚定健康航向,引领AI医疗的潮流。
此外,随着老龄化社会的加剧,社会经济的增长以及市场空间不断扩张的引力,将推动AI医疗行业快速发展。随着人们健康意识的日益觉醒和对医疗服务质量要求的不断攀升,对AI医疗产品和服务的渴望将持续增长,特别是在肿瘤早筛、老年健康管理等民生项目领域,华大基因等AI医疗龙头企业凭借前沿的技术、海量的数据以及卓越的创新能力,不断探索医疗难题的解决方案,敏锐捕捉市场需求,将有望成为攻克医疗难题的利刃以及开辟广阔市场空间的强劲新动力,引领医疗行业迈向崭新的发展阶段。