高通推出Cloud AI 100 Ultra云推理卡,单卡可运行100B参数大模型
IT之家
2023-11-15 13:22:53

原标题:高通推出Cloud AI 100 Ultra云推理卡,单卡可运行100B参数大模型

IT之家 11 月 15 日消息,高通发布了 Cloud AI 100 Ultra,属于云 AI 推理加速卡,专为生成式 AI 和大型语言模型而设计。

这款产品可提供相当于上一代产品四倍的性能,可以在单张 150W 的卡上部署 100B 参数模型,在两张卡上部署 175B 参数,甚至还可以通过高通 AI 堆栈和云 AI SDK 的多 个 Cloud AI 100 Ultra 支持更大的模型。

据介绍,高通 Cloud AI 100 Ultra 是一个可编程的 AI 加速器,可以支持最新的 AI 技术和数据格式。

它利用高通 AI 堆栈,可以使客户能够“在任何地方训练并在高通 Cloud AI 100 Ultra 上进行推理”,从而支持模型的移植和优化。

正如其名,这是一款云加速卡,它背后依赖的是慧与科技专为加速器优化的生成式 AI 工作负载(IT之家注:包括自然语言处理 NLP)设计的 HPE ProLiant DL380a Gen 11 服务器。

根据高通官方的说法,Cloud AI 100 平台在最新基准测试结果的所有加速卡中均处于领先地位,但不清楚最新 Cloud AI 100 Ultra 的具体结果。

高通表示,在云和企业用例中,与竞争对手相比,高通 Cloud AI 100 Ultra 在生成式 AI(包括 LLMs、NLP 和计算机视觉工作负载)方面每 TCO 美元提供两到五倍的性能。

他们认为,这种性能、定价、功率、效率、可扩展性和安全性的结合,使其成为希望采用尖端 AI 并转变其运营的组织的理想选择,同时支持可持续发展目标。

相关内容

热门资讯

差点被人抢走了!今天打了10分... 许多网友在网络游戏中最喜欢的便是PVP中人与人对抗的刺激感,特别是在势均力敌的战斗中,大家都在拼意识...
PS6性能会落后Xbox新主机... 来源:环球网 【环球网科技综合报道】3月14日消息,下一代游戏主机的轮廓正逐渐清晰,关于硬件性能的...
又一万亿级产业,爆发! 来源:央视财经 中国卫星导航系统管理办公室13日发布消息,为提供更加优质的服务,北斗卫星导航系统将于...
隧道施工智能化落地|五大核心电... 大家好,针对隧道施工环境复杂、人员流动性大、安全监管难度高的行业痛点,结合我们在云南/云南地区的项目...
联想Yoga Slim 7a海... IT之家 3 月 14 日消息,联想现已在欧洲市场推出第 11 代 Yoga Slim 7a 笔记本...