“科创中国”平台依托创新资源与数据能力,聚焦“高质量、可转化、有潜力”的科技成果推出“成果发布厅”栏目。栏目定期发布具有实际转化价值的优质成果,助力科技成果加速落地,服务区域和产业高质量发展。本期科技成果发布厅(第一百零七期)推广来自人工智能成果发布厅的精选成果。
✦
•
✦
类脑行业大模型基座
(精选成果推广)
成果介绍
中国电子科技南湖研究院自主研发“类脑行业大模型基座”,以类脑线性架构为核心,融合大模型技术,具备长文本处理、低功耗快速响应等优势,支持跨平台兼容与多领域复用,已在医疗、心理、电力、能源等多个场景成功落地。
团队攻克垂域训练关键技术,构建多源异构数据集,通过OCR、文言文转化、去重与质量评估实现高质量数据清洗;创新研发RAG-富知识检索系统,融合脑启RAG与SNN检索技术,显著提升检索精度与效率,缓解模型幻觉,支撑高可靠行业推理。基座采用“聪明大脑+图书馆”模式,通过外部知识库动态检索替代全量训练,兼顾数据隐私、知识快速更新与行业数据库灵活切换,有效构筑行业竞争壁垒。
应用方面,“素问”医疗大模型在CMB-Exam评估中以94.12分夺冠;“栖心”心理大模型提供情绪陪伴服务;电力领域为中国大唐提供能源优化支持,并与浙江中医药大学合作开发中医药RAG系统。多场景横向拓展验证了基座的通用性与可复制性,为能源、制造、政务等行业的智能化升级提供标准化技术支撑。
成果亮点
类脑行业大模型基座的核心亮点在于“技术突破-场景验证-生态构建”的全链条创新,具备四大独特优势:
一是类脑线性架构的跨行业适配性。突破传统“黑箱”模式,采用“聪明大脑+图书馆”设计,融合类脑线性模型与RAG技术,将行业知识库作为可动态检索的“外挂图书馆”,兼顾数据隐私、快速更新与多数据库切换,形成行业壁垒,灵活适配医疗、能源、制造等多元场景。
二是垂域训练的全流程能力。团队构建覆盖专业书籍、对话、案例的多源异构数据集,通过OCR、文言文转换、去重与质量评估实现数据高效清洗与降噪;训练中优化长文本与多轮对话能力,结合类脑芯片算力底座,实现低功耗、高响应的复杂推理。
三是RAG技术的类脑增强。创新研发RAG-富知识检索系统(含脑启RAG与SNN retriever),显著提升检索效率与准确性,在CCF大数据赛中近千支队伍位列第二,有效缓解大模型幻觉,支撑医疗诊断、能源调度等关键应用。
四是多场景落地验证。技术已成功应用于医疗(“素问”大模型CMB-Exam夺冠)、心理(“栖心”情绪陪伴)、电力(服务中国大唐)等领域,并拓展至中医药信息化,验证了其通用性与可复制性,为多行业提供标准化技术基座。
团队介绍
中国电子科技南湖研究院类脑行业大模型基座研发团队是一支融合国际顶尖学术背景与产业实战经验的多学科交叉团队,聚焦类脑计算与垂直领域大模型的深度融合。
团队领军人蔡炎松博士毕业于德国弗莱堡大学,主攻计算神经科学;2016至2019年任新加坡科技研究局类脑计划项目子课题负责人(PI),与多家顶尖机构合作推进前沿研究;2019至2021年任华为2012实验室类脑计算组算法首席专家,领导跨国算法团队,获四项华为创新奖。
团队汇聚类脑算法、数据科学、行业应用与算力架构等多领域人才,致力于脑启发AI与芯片/软件协同研发,具备从基础研究到产业落地的全链条创新能力。在数据工程方面,擅长构建高质量多源异构垂域数据集,结合OCR、文言文转换与去重技术保障数据质量;模型训练中融合类脑芯片特性,优化长文本处理与多轮对话,实现低功耗高效响应;创新研发类脑RAG系统,有效缓解大模型幻觉问题。
依托深厚的国际科研积累与产业实践经验,团队已推动技术在医疗、心理、电力等领域落地,为能源、制造、政务等行业的智能化升级提供核心支撑。