国产GPU升级万卡集群
创始人
2024-07-07 00:40:49

本报讯(记者 孙奇茹)日前,总部位于北京的国产GPU企业摩尔线程宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。

“AI模型训练的主战场,万卡已成为标配。”摩尔线程创始人兼CEO张建中说。随着计算量不断攀升,大模型训练亟需超级工厂,也就是一个“大且通用”的加速计算平台,从而缩短训练时间,实现模型能力的快速迭代。

所谓万卡集群,是指由一万张及以上的计算加速卡(如GPU)组成的高性能计算系统,用以训练基础大模型。据了解,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项高度复杂的超级系统工程。“可以把万卡集群想象为一个万人团队,团队需要有非常强的沟通机制,才能协同把一件事情做好。”摩尔线程相关负责人说,希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。

稳定性方面,夸娥万卡集群平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。

相关内容

热门资讯

触乐怪话:当我关心你在想什么 触乐怪话,每天胡侃和游戏有关的屁事、鬼事、新鲜事。 百病退散(图/小罗) 前两天上完编剧夜校课乘...
三国杀:远古武将也能有超大过牌... 大家好,这里是你们的老朋友手杀菌!提起三国杀2016年的一将成名,你会想到哪些武将呢?是东吴自爆小卡...
心动首款开放世界MMO今日测试... 记忆中的仙境是什么样子? 文/林致 今天(5月20日),心动的《仙境传说RO:守护永恒的爱2》(下称...
【维护公告】5月20日维护公告... 亲爱的少侠: 为保证服务器的稳定和提升游戏品质,天龙八部手游全区全服将于5月20日4:00~11:...
《冒险岛》怀旧服“归岛测试”今... 玩手游网(www.wanshouyou.net)2026年05月20日:对于无数80、90后的玩家来...