来源:21世纪经济报道
当万卡集群成为AI军备竞赛的入场券,一个长期被忽略却至关重要的“隐形瓶颈”正浮出水面:卡与卡之间的互联堵、功耗高、时延大。算力堆得再高,信号却堵在“红绿灯”前,成了整个系统运转的最大拖累。OCS——光电路交换机,正是解开这道死结的钥匙。
要理解OCS,不妨先看一个比喻。传统的数据传输,好比一条国道,光信号跑着跑着就遇到收费站,必须停下来转换成电信号才能继续通行。每次交换都要经历“光→电→光”的转换。每一站都有“红绿灯”,不仅跑不快,还巨费电。
而OCS做的,就是把这些收费站统统拆掉,让光信号直接在光路里完成交换,全程不用来回折腾。OCS本质上是一个光开关矩阵,通过动态调整光路,建立端到端的光通道,像在高速公路上直接架起立交桥,让数据直来直往。这正是AI大模型训练最需要的通信方式:高带宽、低时延、低功耗。
与传统电交换机相比,接下来将介绍OCS的4个核心优势:
1.延迟压到纳秒级
OCS无需光电转换,交换延迟达到纳秒级别,仅为传统电交换机的1/100。在万卡集群中,这种“毫厘必争”的协同效率提升,能有效减少算力浪费。
2.功耗低
传统电交换机每做一次光电转换都要耗费大量电能,而OCS仅驱动模块耗电。根据朗维光子的数据显示,OCS端口功耗较同等带宽电交换机降低60%以上,能大幅降低数据中心运营成本。
3.架构简化
传统数据中心采用"核心-汇聚-接入"三层架构,数据包需要多次跳转。OCS支持全光交叉连接,可以实现光信号的"一跳直达",减少中间汇聚层级。这种扁平化架构降低了时延,还提升了网络可靠性。
4.故障秒级切换
OCS支持故障节点秒级切换和断点续训,保证模型长稳续训能力。采用模块化设计,配备冗余电源与智能监测系统,将潜在停机时间降至最低。
当AI大模型的训练规模从千卡向万卡、甚至十万卡迈进,传统电交换机的带宽收敛和功耗墙问题已经触顶。而OCS正凭借其全光传输的低时延、低功耗、高扩展性,成为下一代AI算力网络的核心基础设施。
视频内容由越声理财投资顾问:陈嘉辉(登记编号:A0590622120002)、袁水洋(登记编号:A0590619110002)等进行编辑整理,视频中的信息均来源于公开资料,仅代表个人观点,任何投资建议不作为投资依据。
上一篇:Modos Flow便携显示器预热:配13.3英寸60Hz墨水屏面板
下一篇:没有了