IT时报记者 贾天荣
12月18日,首届光合组织人工智能创新大会(HAIC2025)在昆山国际会展中心举办。大会以“智算无界,光合共生”为主题,汇聚全产业链超2500家企业代表、专家学者及行业领袖,全景呈现中国AI计算开放架构的创新实践与生态繁荣。
大会期间,展厅内最引人注目的区域之一,是一组玻璃幕后的巨大实体机柜。《IT时报》记者在现场看到,透明侧板内,高压直流模块、高性能计算主板、气体连接器等精密构造清晰可见。液冷机柜正实时跳动,直观展示着系统在高负载运行下的稳定表现。这里,正是中科曙光发布并展出的全球领先大规模智能计算系统——scaleX万卡超集群的首次公开亮相。
scaleX万卡超集群由16个超节点构成,可支撑部署10240块AI加速卡,总算力超5EFLOPS,其单机柜算力密度提升20倍,PUE(电能利用效率)低至1.04。因基于“AI计算开放架构”设计,scaleX万卡超集群可支持多品牌加速卡及主流计算生态,并实现对超过400个主流大模型、世界模型的适配优化。
当前,人工智能已实现从辅助工具到核心生产要素的根本性跃迁。科学大模型、世界模型、具身智能等前沿方向迅猛发展,对底层算力提出了前所未有的规模与性能要求。然而,繁荣背后,“性能墙”与“生态墙”双重制约依然突出——高端算力供给不足、软硬件适配不畅、技术标准不一、应用成本高昂,已成为广大中小企业发展的显著壁垒。
在当前国产算力加速推进的大背景下,AI 生态是否要“开放”,正在成为产业分化的重要分水岭。面对不少厂商选择自建封闭体系、强化生态绑定,中科曙光却选择了一条看似“逆势”的路径。
中科曙光高级副总裁李斌在接受采访时表示,这一选择是来自多年市场实践的结果。
“人工智能的产业链非常长,从芯片、系统到应用,任何一个环节都无法单独支撑起完整价值。但现实情况是,大家又必须把这些环节紧耦合在一起,这就导致一个问题——如果只做好自己那一段,很难形成市场,于是很多厂商开始‘什么都做一点’。”
但结果并不理想。一方面,各家都没有把某一个环节真正做到极致;另一方面,又形成了多个彼此割裂的小生态。对用户而言,选择反而变得更加困难——“哪一家都在做,但哪一家都不够好”。
“这种状态,无论是对国家层面的产业发展,还是对产业链企业自身,其实都不可持续。”李斌直言,在高度内卷的情况下,企业既没有找准自己的位置,也难以形成真正的协同。
基于这一判断,中科曙光选择以AI计算开放架构为核心,把在芯片、系统、工程和调度等多个环节长期积累的能力开放出来,让合作伙伴各自回到最擅长的领域。“大家把各自最强的那一块做好,协力完成一件事,反而更有可能跑通整个产业链。”
在此背景下,“开放”从可选项转变为产业突破瓶颈、实现可持续发展的行业共识。正如国家先进计算产业创新中心主任历军所言,市场需要开放、高效、安全、稳定的智能计算基础设施,应该建设开放、共享、分工、协作、团结、共赢的产业格局。
大会还发布了多款超节点、AI终端等光合生态人工智能创新成果,从尖端行业的高强度算力需求到万千用户的办公娱乐需要,从高效运算到智能交互,它们承载着光合生态“普惠智算”的初心。
开放架构下最瞩目的成果是scaleX万卡超集群。该集群面向万亿参数大模型与前沿科学智能等极致场景设计,由16个scaleX640超节点通过全栈自主研发的原生RDMA高速网络互连而成,硬件支持多品牌AI加速卡,软件兼容主流计算生态。它是对开放架构技术路线与系统工程创新的“集大成”式验证,标志着我国在构建世界一流超大规模智算基础设施上取得关键突破。
“scaleX万卡超集群,是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案”。李斌表示,面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越海外同类产品研发路线图的2027年NVL576里程节点。
scaleX 万卡超集群的意义并不只体现在规模上。中科曙光高性能计算软件研发总经理吕灼恒指出,相比传统超级计算机,万卡级智能计算集群带来的是“质的变化”。
首先是产业供给能力的变化。在不少传统行业中,算力不足往往直接拉长研发与生产周期。以新药研发为例,大规模模拟与计算能力的提升,将显著改变过去“算力不够、周期被动延长”的局面。
其次是科研与工程范式的变化。此次发布的多项协同技术,把数据、算力与模型进行一体化管理,再通过数字孪生与智能调度体系,让科研人员不再需要分心底层运维与资源配置,而是聚焦核心研究任务本身。
“这是从过去偏经验、偏数据驱动,向模型与数据协同驱动的转变。”吕灼恒认为,这种变化的受益者并不仅限于科研机构,而是覆盖多个关键行业。
在金融领域,高速网络与大规模算力可以同时满足高时效结算需求与数据安全、金融信创等要求;在制造业,尤其是新能源汽车产业,大量仿真、校正、前处理和后处理计算,对算力的依赖正在成为基础能力。“算力本身,正在推动整个国家基础设施和制造业体系发生质变。”他说。
此次大会发布了AI终端、超节点、超集群等创新成果,会上,商汤科技、中科曙光、大晓无限机器人、麒麟软件、华大九天、海光信息等企业达成多项战略合作,围绕AI算力软硬件系统优化、世界模型与具身智能应用创新等开启跨层开放协作。
海光信息副总裁吴宗友告诉记者,过去单纯依靠芯片本身的性能,已经很难真正满足用户需求。“芯片再强,最终也要跑在不同的整机、操作系统和软件之上,性能必须通过整个系统才能交付。”
目前,海光一方面持续打磨自身 CPU 与 DCU 等产品,另一方面更加重视从芯片向上“拉起”生态——覆盖整机、操作系统、数据库、云平台以及各类应用软件。
这种协同带来的改变是,厂商可以向用户交付的不再是“一颗芯片”,而是一整套可用、可优化、可定制的系统能力。更重要的是,许多优化并非事后适配,而是在芯片研发阶段,就已经与数据库、云厂商、操作系统厂商提前协同完成。
“最终的最大受益者,其实还是用户。”吴宗友强调。
谈及未来竞争格局,他认为国内厂商之间的协同将变得更加关键。“我们更愿意把 CPU 的能力开放给更多的卡厂,而不是只服务于某一个品牌或项目。大家把各自的事情做好,形成一个更健康的市场环境,对整个国产算力生态都是正向提升。”
此外,会上还公布了科学智能联合攻关行动、AI计算开放架构联合实验室首批项目组协同创新计划,旨在汇聚顶尖力量,针对科学大模型、多元异构算力融合、统一基础软件栈、超大规模集群优化等共性关键技术开展联合攻关,将开放协作深入研发源头;开启光合组织生态筑基行动、光耀百城2.0计划,推动产业链各环节产品以标准接口协同工作,诠释了开放生态从“全链覆盖”到“价值闭环”的演进。