最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货
机器之心Pro
2023-11-14 19:24:52
0

原标题:最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货

机器之心报道

编辑:蛋酱、陈萍

芯片巨头英伟达,又打出一张王牌。

英伟达在 2023 年全球超算大会(SC2023)上发布了目前世界上最强的 AI 芯片 H200。

这款新的 GPU 基于 H100 进行了升级,内存带宽提高了 1.4 倍,内存容量提高了 1.8 倍,提高了处理生成式 AI 任务的能力。该公司高性能计算和超大规模数据中心业务副总裁 Ian Buck 表示:「英伟达在硬件和软件上的创新正在缔造新型 AI 超算。」

英伟达在官方博客中表示:NVIDIA H200 Tensor Core GPU 具有改变游戏规则的性能和内存功能,可增强生成式 AI 和高性能计算 (HPC) 工作负载。作为首款采用 HBM3e 的 GPU,H200 借助更大更快的内存可加速生成式 AI 和大型语言模型 (LLM) 的运行,同时推进 HPC 工作负载的科学计算。

除此以外,Buck 还展示了一个服务器平台,该平台通过 NVIDIA NVLink 互连连接四个 NVIDIA GH200 Grace Hopper 超级芯片。四核配置在单个计算节点中配备了多达 288 个 Arm Neoverse 内核和 16 petaflops 的 AI 性能,以及高达 2.3 TB 的高速内存。

大模型推理加速 1.9 倍

NVIDIA H200 基于 NVIDIA Hopper 架构,与 H100 相互兼容,这意味着已经使用先前模型进行训练的人工智能公司将无需更改其服务器系统或软件即可使用新版本。

H200 是首款以 4.8 TB/s 速度提供 141 GB HBM3e 内存的 GPU,这几乎是 NVIDIA H100 Tensor Core GPU 容量的两倍。H200 还配备了高达 141GB 超大显存,与 H100 的 80GB 相比,容量几乎翻倍,并且带宽还增加了 2.4 倍。

H200 更大更快的内存可加速生成式 AI 和 LLM 的运行,同时以更高的能源效率和更低的成本推进 HPC 工作负载的科学计算。

例如,在处理 Llama2 等 LLM 时,H200 的推理速度比 H100 GPU 提高了近 2 倍。

运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的推理性能提高了 18 倍。不仅如此,在其他生成式 AI 基准测试中,还能在 Llama2-13B 上每秒可处理 12000 个 tokens。

内存带宽对于 HPC 应用程序至关重要,因为它可以实现更快的数据传输,减少复杂的处理步骤。对于那些内存密集型 HPC 应用如模拟仿真、人工智能研究等,H200 更高的内存带宽可确保高效地访问和操作数据,与 CPU 相比,给出结果的时间最多可加快 110 倍。

随着 H200 的推出,能源效率和 TCO 达到了新的水平。

下图为 H200 一些参数介绍:

英伟达表示,从明年开始,亚马逊网络服务、谷歌云、微软 Azure 和甲骨文云基础设施将成为首批部署基于 H200 实例的云服务提供商。

官网信息显示,H200 将于 2024 年第二季度开始向全球系统制造商和云服务提供商供货。但对于 H200 的价格,英伟达还没有透露具体数字。CNBC 报道称,上一代 H100 的售价估计为每台 2.5 万美元至 4 美元,需要数千台才能以最高水平运行。

关于 H200 是否会像 H100 一样供应紧张,英伟达对此并没有给出答案。

在给 The Verge 的邮件中,英伟达发言人 Kristin Uchiyama 表示 H200 的亮相不会影响 H100 的生产:「你会看到我们全年的总体供应量有所增加,并且我们将继续长期购买供应。」

最新一期超算 Top500 出炉

8 成新上榜系统使用英伟达 H100

与此同时,SC23 大会还发布了最新一期超算 TOP500 榜单。Frontier 系统仍保持榜首位置,并且仍然是榜单上唯一的百亿亿次计算机,但前十名的格局已经被五个新的或升级后的系统改变。

榜单地址:https://www.top500.org/lists/top500/2023/11/

在新一期榜单中,使用英伟达技术的超算系统数量达到了有史以来的最高水平 379 台,其中包括 49 台新上榜超算中的 38 台。这一数字在今年 5 月份是 372 台。

英伟达为这些系统提供了超过 2.5 exaflops 的高性能计算性能,高于 5 月份的 1.6 exaflops。其中,在前 10 名中,英伟达就贡献了近 1 exaflops 的高性能计算性能和 72 exaflops 的 AI 性能。

比如,微软 Azure 的 Eagle 系统在 NDv5 实例中使用了 H100 GPU,以 561 petaflops 的成绩位列第 3,在新上榜的超级计算机中遥遥领先,巴塞罗那的 Mare Nostrum5 排名第 8,英伟达 Eos(最近在 MLPerf 基准测试中创造了新的 AI 训练记录)排名第 9。

基于强大的性能,英伟达未来将为世界各地的超算中心提供更好的算力服务。就在 SC23 大会上,多家超算中心宣布了正在为自己的超算集成 GH200 系统。

比如,德国尤利希超算中心将在「木星」(JUPITER)上使用 GH200 超级芯片,这将成为欧洲第一台百亿亿次超级计算机。

参考链接:

https://blogs.nvidia.com/blog/efficient-ai-supercomputers-sc23/

https://www.theverge.com/2023/11/13/23958823/nvidia-h200-ai-gpu-announced-specs-release-date

相关内容

热门资讯

游戏推荐斗牛房卡出售,牛牛房卡... kAl0M从此前信息来看,苹果目前主要是将 N5和N5P用于其现有的A14、M1系列和A15芯片,那...
游戏牛牛房卡批发价,斗牛房卡批... flm27w毕竟有热度的消息,大家都愿意去挖。也有一些推特博主,也会爆料苹果的新机。所以新机还在孵化...
游戏100元300张房卡,正规... vOdKDp1.顶级的A16仿生芯片将运用到iPhone 14系列上。苹果A16芯片采用先进的4nm...
游戏介绍!牛牛房卡在哪里购买,... ZcYf更高档的一款华为P60 Pro其实配置相比华为P60的区别不大,绝大多数配置都一模一样,包括...
游戏知识!美猴王牛牛房卡哪里买... rDZYYeJiPhone13配备6.1英寸超视网膜XDR显示屏,虽说屏幕没有高刷新率,但60Hz对...
游戏测评!100元300张房卡... 3tX0M而且,iPhone14系列所搭载的处理器也是传出了消息,即使苹果A系列处理器的性能已经和高...
游戏介绍!微信金花房卡销售,正... 2Sg3UiPhone16Pro的单打孔和安卓手机的打孔屏完全不同,因为苹果保留了FaceID,所以...
游戏推荐牛牛房卡游戏平台加盟,... cxXm在核心硬件方面,据悉这款摩托罗拉X50mini采用了高通骁龙7+ Gen2移动平台,高通骁龙...
游戏知识!金花房卡全国代理,金... zIqz本月早些时候,9to5Mac独家报道称,即将推出的 iPhone 15 Pro 将拥有新的统...
游戏测评!斗牛房卡购买联系方式... 8XenW2g苹果手机虽然备受消费者的欢迎,同时也搭载的是自研的iOS系统,但是在很多方面,苹果也借...
游戏推荐12人斗牛房卡那里买,... hWiPhone 14沿袭了iPhone 13设计风格,搭配了一块刘海屏风格的6.1英寸OLED屏,...
游戏测评!微信金花房卡充值,斗... 6Ot3从相机配置来看,这款OPPO Reno10新机采用了后置四摄的设计方案,分别由一英寸大底主摄...
评测!牛牛房卡批发价,大厅房卡... h4x根据目前爆料信息来看,iPhone 14系列中Pro版的两款提升较大,性能、外观、影像以及配色...
游戏!大厅房卡哪里买,金花房卡... 7据悉,“灵动岛”是苹果公司最新的手机设计语言,其能够将通知和其他信息以类似于动画的方式呈现在用户眼...
游戏介绍!牛牛房卡批发,牛牛房... lDwaHxq在摄像头方面,这款realme GT3采用了后置三摄的设计,后置三摄布局在手机背部中间...
游戏知识!金花房卡充值,金花房... kXcciPhone13内置3095mAh电池,支持20W有线+15W无线,别看电池容量比任何一款安...
游戏测评!斗牛房卡出售,微信金... SiPhone16Pro这次的主要卖点,集中在屏幕上的体验和后置相机模组的设计,这两个设计可以说完全...
游戏知识!青龙区斗牛房卡代理,... Z5tLLO是一个为智能手机发展做出了杰出贡献的手机厂商,再加上丰富的技术积累以及强大的研发能力,因...
游戏牛牛房卡价格,正规房卡链接... lqgtinB从外观屏幕来看,这款OPPO Reno10新机采用了一块6.79英寸的三星AMOLED...
游戏指南!牛牛房卡批发价格,新... KIGvvq而且有消息称iPhone14系列中的标准版和新增的Max版本都将搭载A15处理器,又或者...