可并行运行128个LLaMA 2 7B流,开发者测试M2 Ultra模型推理表现
IT之家
2023-10-13 18:05:33

原标题:可并行运行128个LLaMA 2 7B流,开发者测试M2 Ultra模型推理表现

IT之家 10 月 13 日消息,据 Y Combinator 论坛消息,名为 Georgi Gerganov 开发者日前使用苹果 M2 Ultra 芯片,进行了一系列 LLaMA 模型推理测试,测试显示该芯片在并行运行 128 个 Llama 2 7B 流时,效果较佳

▲ 图源 Georgi Gerganov 在 GitHub 披露的测试表现

据悉,LLaMA 模型推理测试强调内存带宽,而非计算能力,而苹果的 M2 Ultra 芯片号称“内存带宽达 800GB/s”,因此推理时效果良好

▲ 图源 Georgi Gerganov 在 GitHub 披露的测试表现

不过虽然 M2 Ultra 芯片的内存带宽具有优势,但用户最多只能获得 192 GB RAM,用户花费 5600 美元(IT之家注:国行 44999 人民币)购买搭载 M2 Ultra 芯片及 192GB 运行内存的 Mac Studio,价格足够买一台“拥有 1TB RAM、搭载 RTX 4090 的 PC”

▲ 图源 Y Combinator

▲ 图源 苹果官网

Georgi Gerganov 据此认为,如果用户的工作负载(如推理)不需要超过 192 GB,那么选择相关机器时可以更重视“内存带宽”表现,但如果用户有其他工作需求,则可以看看相对应价格的 PC。

参考

相关内容

热门资讯

《识质存在》MTC均分87 黑... 作为卡普空的全新IP,小萝莉搭配大叔的科幻动作射击游戏《识质存在》媒体评测解禁。根据Metacrit...
原创 歧... 《歧路旅人大陆的霸者》国服4月第3周新角色出炉,商人猫利克复刻,对于这个角色G哥印象深刻,这个角色赖...
B社回应PS5版《星空》频繁崩... IT之家 4 月 14 日消息,B 社游戏工作室(Bethesda)在社交媒体上发布公告,回应了大量...
《神泣:纷争》4.15公测上线... 作为经典端游《神泣》的正版手游)——《神泣:纷争》明天(4月15日)就要公测啦! 新手入坑最纠结的莫...
《深海迷航2》Steam与微软... 《深海迷航2》开发商Unknown Worlds创始人与发行商KRAFTON(魁匠团)的诉讼风波已经...