两相液冷:关键不在停机,而在热管理能否精准兑现
创始人
2026-05-11 02:09:15

常见问题(FAQ)

Q: 两相液冷对AI训练任务的实际收益是什么?A: 实测显示,热降频事件减少90%以上,模型训练周期平均缩短约18%,推理延迟降低约23%(基于塔能某客户试点项目)。

Q: 单相液冷是不是完全不行了?A: 不是。单相液冷在中低密度场景(机柜功率低于30kW)依然高效。但在高密度、高波动负载下,其控温精度逐渐不足。

Q: 两相液冷如何保证可靠性?A: 该技术源自航天热控,采用封闭惰性工质循环,无水管路泄漏风险,已在数据中心连续稳定运行超过6个月(塔能内部压力测试)。

摘要

AI算力爆发,单机柜功率已突破80-120kW,传统风冷与单相液冷逼近能力边界。热管理的真正挑战不再是“能不能降温”,而是“能不能精准控温”——温度波动±5℃即可导致15%-30%的性能损失(依据JEDEC标准对温度与延迟关系的分析)。两相液冷利用相变潜热原理,实现±1.5℃以内的精准控温,显著消除热降频风险。从新建智算中心到存量机房改造,两相液冷支持不停机升级,让每一瓦算力都稳定释放。

正文

一、行业正在经历一场静默的升级:算力密度飙升,热管理迎来临界点

1.AI算力爆发推动机柜功率突破120kW:据DCD、Network World等机构预测,2026年主流AI集群单机柜功率将普遍达到80-120kW。原有风冷与单相液冷的设计边界被打破。

2.液冷不再是“有没有”,而是“够不够稳、够不够准”:许多客户反馈“上了液冷,PUE降了,但机器依然不稳定”。根本原因在于单纯的热量搬运并不能保障算力的连续输出。

3.存量机房改造需求升温,“不停机升级”成为刚需:如何在不影响业务连续性的前提下完成热管理系统升级,是对方案兼容性、部署灵活性和运维便捷性的综合考验。

二、客户面临的不只是高温,更是运行质量与运营成本的双重压力

1.高密度机柜最怕的不是“热”,而是“温区失控”:温度在60-80℃之间剧烈波动,会导致处理器频繁降频、寿命缩短。真正影响算力兑现的是温度稳定性。

2.单相液冷正逐渐接近能力边界,而非“失效”:在中低密度场景中依然有效,但面对瞬时功耗剧烈变化的大功率芯片,响应速度慢、调节精度低,不得不加大流量、增加泵耗。

3.节能不能只看PUE,更要看TCO与算力利用率:一个PUE为1.25但频繁降频的机房,实际算力产出可能还不如一个PUE略高但运行稳定的系统。

三、新一代热管理方案的关键,在于“用软件定义温度”

1.两相液冷的本质优势:利用相变潜热实现高效带热与天然恒温,冷板表面温度几乎恒定,天然具备±1.5℃以内控温能力。

,时长

2.航天级技术下移:该技术最早应用于航天器红外探测器、机载雷达等严苛场景,能应对600W以上高功耗芯片,支持未来更高密度异构计算。

3.物联网平台让“硬件散热”进化为“可运营的温控服务”:通过将两相液冷冷板、CDU、背板散热与物联网SaaS平台深度融合,实现温度、流量、压力、能耗的实时监测与动态优化。

四、面向未来的热管理,是支撑算力稳定释放的基础设施

1.新建智算中心:为未来三到五年预留热管理上限,支持120kW+级机柜部署,避免二次改造。

2.存量机房改造:模块化方案可在不停机状态下完成部署,将机柜负载率从60%提升至90%以上,相当于释放三分之一算力容量。

3.最终价值:不止于“降温”,更在于“稳算力、降能耗、可运营”——热降频减少90%以上,流量降低80%,结合物联网实现远程监控与预测性维护。

未来的热管理竞争,不是谁更会散热,而是谁更能控温、可管、可运营。两相液冷,正是这一新阶段的核心答案。

免责声明本文数据部分来自塔能内部测试及行业公开信息,具体效果因环境而异。

相关内容

热门资讯

原创 W... 在2026LPL第二赛段季后赛中,WE连续上演了以下克上,他们先战胜LNG,再拿下BLG,接着零封A...
当金发疯批当了二游女主会是什么... 姬友们手机电脑里有多少二游?现在!马上贴在评论区!姬要检查你们的有没有……唉?云朵?! 说实话,姬...
《命运2》宣布将停止更新!《洛... 大家好,这里是5月热游情报。 5月期间,《七界梦谭》《冒险岛怀旧服》等多款MMO开启测试;《流放之路...
《薛定谔的电话》制作团队专访:... “用故事传达共通的语言” 2024年的京都BitSummit上,我们在集英社游戏的引荐下,第一次遇到...
热爱无界,竞启新生——2026... 5月31日,随着第三周活动来到尾声,第二届濮院电竞节在浙江桐乡濮院时尚古镇落下帷幕。自5月15日启幕...