原创 美国AI芯片初创企业Groq成功融资6.4亿美元
创始人
2024-08-06 14:01:26
0

8月6日消息,美国人工智能(AI)芯片初创公司Groq于当地时间周一成功获得了6.4亿美元的D轮融资,以加强其云端大模型推理能力。

据了解,Groq最新一轮融资由 BlackRock、Neuberger Berman、Type One Ventures、Cisco Investments、Global Brain 和 Samsung T催化剂等公司领投。

这家总部位于美国加利福尼亚州山景城的初创公司成立于 2016 年,是一家 AI 芯片生产商,旨在实现高吞吐量、低成本的推理,而不是训练。该公司核心团队来源于谷歌最初的张量处理单元(TPU)工程团队。Groq 创始人兼CEO Jonathan Ross是谷歌TPU项目的核心研发人员。该公司硬件工程副总裁Jim Miller 曾是亚马逊云计算服务AWS设计算力硬件的负责人,还曾在英特尔领导了所有 Pentium II 工程。截至目前,Groq 总共筹集了超过 10 亿美元,现在的估值已达 28 亿美元。

今年2月,Groq推出了全球首个基于LPU(Language Processing Unit)方案的大模型推理芯片,作为一款基于全新的TSA 架构的Tensor Streaming Processor (TSP) 芯片,旨在提高机器学习和人工智能等计算密集型工作负载的性能。

虽然Groq的LPU并没有采用更本高昂的尖端制程工艺,而是选择了14nm制程,但是凭借自研的TSA 架构,Groq LPU 芯片具有高度的并行处理能力,可以同时处理数百万个数据流,并该芯片还集成了230MB容量的SRAM来替代DRAM,以保证内存带宽,其片上内存带宽高达80TB/s。

根据官方的数据显示,Groq的LPU芯片的性能表现相当出色,可以提供高达1000 TOPS (Tera Operations Per Second) 的计算能力,并且在某些机器学习模型上的性能表现可以比常规的 GPU 和 TPU 提升10到100倍。

Groq表示,基于其LPU芯片的云服务器在Llama2或Mistreal模型在计算和响应速度上远超基于NVIDIA AI GPU的ChatGPT,其每秒可以生成高达500个 token。相比之下,目前ChatGPT-3.5的公开版本每秒只能生成大约40个token。由于ChatGPT-3.5主要是基于NVIDIA的GPU,也就是说,Groq LPU芯片的响应速度达到了NVIDIA GPU的10倍以上。Groq表示,相对于其他云平台厂商的大模型推理性能,基于其LPU芯片的云服务器的大模型推理性能最终实现了比其他云平台厂商快18倍。

另外,在能耗方面,英伟达GPU需要大约10到30焦耳才能生成响应中的tokens,而Groq LPU芯片仅需1到3焦耳,在推理速度大幅提升10倍的同时,其能耗成本仅有英伟达GPU的十分之一,这等于是性价比提高了100倍。

Groq的策略是使用光纤互连将数百个LPU拼接在一起,每个LPU都装有片上SRAM。通过使用 576 个 LPU 的集群,Groq 声称它能够在 Meta 的 Llama 2 70B 模型上实现每秒超过 300 个令牌的生成速率,是具有 8 个 GPU 的 HGX H100 系统的 10 倍,同时消耗十分之一的功率。

Groq公司在演示中展示了其芯片的强大性能,支持Mistral AI的Mixtral8x7B SMoE,以及Meta的Llama2的7B和70B等多种模型,支持使用4096字节的上下文长度,并可直接体验Demo。不仅如此,Groq还喊话各大公司,扬言在三年内超越英伟达。目前该公司的LPU推理芯片在第三方网站上的售价为2万多美元,低于NVIDIA H100的2.5-3万美元。

编辑:芯智讯-浪客剑

相关内容

热门资讯

贵州电网公司有了“小王同事”智... “小王同事,06021DY*015如何装表?” “答案不言而喻,你问的06021DY*015,红岩2...
突破主体互动难关!豆包发布视频... 字节跳动正式宣告进军AI视频生成。9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,一举发布了...
声网发布aPaaS灵动会议 鞭牛士 9月24日消息,声网今日正式发布了aPaaS“灵动会议”,该产品通过领先的RTE技术,融合生...
中国联通:以数智之力守护黄河安... 黄河之水天上来,奔流到海不复回。 黄河安澜是中华儿女的千年期盼,黄河流域的生态保护和高质量发展,是事...
AI+机器人 中控技术发布Pl... 近期,中控技术正式发布了Plantbot机器人解决方案。Plantbot机器人解决方案,是中控技术基...
湖南移动实现娄邵高铁5G信号全... 华声在线9月24日讯(通讯员 赵琨)近日,湖南移动网络建设者经过连续40多天的奋战,顺利完成了娄邵高...
我国将重点推进生态环境监测数智... 今天(9月25日)上午,国务院新闻办公室举行“推动高质量发展”系列主题新闻发布会,生态环境部相关负责...
五颗“无锡产”卫星同箭飞天 本报讯 (记者 房雅雯) “5、4、3、2、1,点火!”9月24日10时31分,中国长征火箭有限公司...
我国首次发布开放原子模型许可证 IT之家 9 月 25 日消息,据央视财经报道,今天(9 月 25 日),我国开放原子模型许可证首次...
首颗由香港研发卫星入轨!捷龙三... 今天(24日)10时31分,捷龙三号遥四运载火箭将天仪41星、“香港青年科创号”卫星等8颗卫星顺利送...
青岛鑫城达取得废料回收装置专利... 金融界2024年9月25日消息,国家知识产权局信息显示,青岛鑫城达机械有限公司取得一项名为“一种收集...
华为压轴机皇来袭!供应链曝华为... 快科技9月25日消息,余承东在华为全场景新品发布会上预告, 原生鸿蒙HarmonyOS NEXT将于...
全新联想拯救者Y700电竞平板... 9月25日,联想拯救者官方正式宣布,全新联想拯救者Y700电竞平板将于9月29日发布。 据了解,全新...
中兴通讯系列终端亮相2024国... 9月25日,中兴通讯携AI 驱动的全场景智慧生态3.0亮相2024北京国际信息通信展。基于AI fo...
我国将建立健全数字人标准体系 ... 以“数字人应用与未来”为主题的首届中国数字人大会9月24日在北京开幕,工业和信息化部负责人在会上表示...
豆包视频生成大模型正式发布 鞭牛士 9月24日消息,字节跳动旗下火山引擎今日在深圳举办AI创新巡展,正式发布了豆包视频生成-Pi...
联发科天玑9400的发表日确定... 一直传出OPPO最新的Find X8与vivo的X200这两个旗舰系列机种都将搭载联发科天玑9400...
中科院计算所与阿里云发布高通量... AI技术爆发性增长引发算力需求,算法优化、硬件升级、系统架构等多维度都需要深度创新,以满足日益增长的...
中国电信持续增强网络安全自主可... (记者 蒋龙龙)中国电信广东郁南分公司开展反诈、量子密话、安全大脑等业务宣传,中国电信安徽阜阳分公司...
安徽联通阜阳市分公司打造光储一... 随着 5G 网络的普及,如何在满足通信需求的同时,又能节能降费,成为通信运营面对的重要课题。积极落实...