随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。
近日,清华大学团队在超高性能计算芯片领域取得新突破。清华戴琼海院士团队与乔飞副研究员团队再迎芯片新成果,他们造出一款名为 ACCEL 的光电融合芯片。
系统级算力和能效,超现有芯片万倍
这枚芯片基于纯模拟光电融合计算架构,在包括 ImageNet 等智能视觉任务实测中,相同准确率下,比现有高性能 GPU 算力提升三千倍,能效提升四百万倍,具备超高算力、超低功耗的特点。
相关成果以《面向高速视觉任务的纯模拟光电计算芯片》(All-analog photo-electronic chip for high-speed vision tasks)为题发表在 Nature 上。
相关论文(来源:《Nature》)
据悉,ACCEL 芯片光学部分的加工最小线宽仅采用百纳米级,而电路部分仅采用 180nm 互补金属氧化物半导体(CMOS,Complementary Metal Oxide Semiconductor)工艺,已经比 7nm 制程的 GPU 取得了多个数量级的性能提升。
论文中的实验演示表明,该芯片的成功研制证明了光子计算在诸多 AI 任务中的优越性(即光子霸权),也为解决摩尔定律增速放缓、构建生态能源友好的大规模 AI 计算框架开辟了新路径。
研究人员表示:“形象来说,如果原本的电量可支持现有高性能芯片工作一小时,那么相同的电量供给下 ACCEL 芯片可以工作五百多年。”
光电芯片(清华大学供图)
全新计算架构:光芯片瓶颈的破壁者
实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。
相比传统电子芯片,光芯片使用光子来完成相关计算。与传统的电子芯片相比,它并不是用电作为载体来完成数字信号处理,而是通过光在传播和相互作用之中的信息变化来进行计算。光计算芯片的优势在于光子的高速度、低耗能和大带宽,这能为大规模并行计算和高速数据传输提供极具潜力的解决方案,被认为是未来颠覆性计算架构的最有力竞争方案之一。相关概念公司有太辰光、华工科技等。
然而,目前的光计算系统面临着非线性实现复杂、光电接口耗能等国际难题,导致不少科研工作评估的高性能优势难以落地并实现应用。
如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度,实现高速高效的片上非线性?如何提供光计算与电子信号计算的高效接口?全新计算架构成为破局的关键。
清华大学团队创造性地提出了光电深度融合的计算框架。从最本质的物理原理出发,结合了基于电磁波空间传播的光计算,与基于基尔霍夫定律的纯模拟电子计算,“挣脱”传统芯片架构中数据转换速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个国际难题。在保证高任务性能的同时,还实现超高的计算能效和计算速度。
谈及美高端芯片对华全面禁令的背景下新计算框架突破的意义,戴琼海院士在与南都记者的连线中表示:“在人工智能时代将新架构真正落地到现实生活,是后续更重要的攻关,也是解决国计民生重大需求的题中之义,是我们的责任与使命。”
综合:南都记者 吕虹