在DeepSeek推理任务中,华为昇腾910C已达英伟达H100性能的60%!
创始人
2025-02-05 16:01:47
0

2月5日消息,据tomshardware等多家媒体报道, 华为最新的AI处理器昇腾910C(Ascend 910C)的推理性能已经达到了英伟达(NVIDIA)H100 GPU的60%。虽然昇腾910C性能与英伟达最新的Blackwell系列AI芯片相比仍有很大差距,但它有助于降低中国对英伟达GPU的依赖。

根据DeepSeek 研究人员的测试数据显示,在执行基于DeepSeek模型的推理任务中,昇腾910C性能可达到英伟达H100的60%。

这显示出,华为尽管受美国的制裁,无法获得台积电的先进制程技术的支持,华为AI处理器的能力仍在快速进步。据介绍,昇腾910C采用chiplet封装,整合约530亿个晶体管。过去昇腾910芯片采用台积电N7+制程,而昇腾910C芯片则由中芯国际第二代7纳米级(N+2)制程制造。

若透过手动优化CUNN核心,昇腾910C性能还可进一步提升。此外,DeepSeek 对升腾处理器的原生支持,以及其PyTorch储存库可让CUDA到CUNN无缝转换,让华为硬件更容易整合到AI工作流程中。

据了解,DeepSeek的支持为华为芯片带来了关键优势: 从第一天起就支持华为昇腾芯片,自主维护PyTorch仓库,只需一行代码就能将CUDA转换为CANN;而且性能优化潜力巨大,通过定制优化可达到更高性能。

据华为官网介绍, CANN(Compute Architecture for Neural Networks)是昇腾针对AI场景推出的异构计算架构 ,对上支持多种AI框架,对下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供高效易用的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。

据了解,CANN分社区版和商用版。 前者是快速提供新特性的体验版,供开发者提前试用;而后者是满足商用标准的稳定版本。目前,CANN社区版已经来到了8.0.0.alpha003版本,针对Ascend C进行了特性增强。而商用版CANN 8.0.RC3版本也已经发布,新增适配7个操作系统,简化了CANN安装流程。

DeepSeek的Yuchen Jin表示,“长周期训练的稳定性是中国芯片最大难关”。这涉及英伟达软硬体生态系统的深度整合,CUDA护城河已经发展二十多年。虽然推理性能可继续改善,但持续的训练工作负载需要华为进一步改进软硬体堆叠。

有专家预测,随着AI模型向“Transformer构架”(如GPT、BERT等)靠拢,CUDA和PyTorch编译器的重要性将降低。此外,DeepSeek 团队在软硬体优化方面的专长,也可能大幅降低对英伟达CUDA的依赖,大幅节省成本。

此前的研究显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。这似乎也意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。

对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。

北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。 假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口 , 就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

编辑:芯智讯-林子

相关内容

热门资讯

又来!澳大利亚禁用DeepSe... 文︱陆弃 澳大利亚政府再一次对中国科技企业下手,以所谓“国家安全”为借口,全面封杀中国大语言模型De...
深海探秘!我国中微子望远镜布网... 近日,一项深海科研壮举在南海海域成功上演,由中国科学院高能物理研究所携手中国海洋大学、中国科学院声学...
DeepSeek+机器人=? 蛇年春节前夕,中国人工智能公司DeepSeek以低成本训练方式引领全球市场。该公司的出现可能重构具身...
多家知名平台,集中上线Deep... 据中国基金报2月3日报道,近日,百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平...
原创 华... 华为,作为国内手机界的“大佬”,一直在科技圈里风生水起,不仅在高端市场闯出了名堂,连中端市场也不甘落...
海南新成立算力科技公司,注册资... 近期,一家名为海南省算力科技有限公司的新企业正式宣告成立,引起了业界的广泛关注。据悉,该公司的法定代...
天翼云率先支持DeepSeek... 中国电信今日正式揭晓了一项重要进展,宣布其天翼云已成为国内首批支持DeepSeek-R1模型的云服务...
淄博悦卡取得多功能加热盘专利,... 金融界2025年2月4日消息,国家知识产权局信息显示,淄博悦卡电器科技有限公司取得一项名为“多功能加...
ios云手机:哪个云手机便宜好... **一、云手机市场概览:寻找性价比之王** 在当今数字化时代,云手机逐渐成为许多用户的新宠。无论...
在DeepSeek推理任务中,... 2月5日消息,据tomshardware等多家媒体报道, 华为最新的AI处理器昇腾910C(Asce...
沧州配送血液可以“打飞的” 转自:河北日报 沧州配送血液可以“打飞的” 本报讯(记者袁铮)1月21日,一架载有血液制品的无人机从...
微信春节数据报告:超275万场... 微信“送礼物”春节首秀,书籍品类环比增长10000%+ 微信红包拜年,已经成为当之无愧的线上年俗,而...
2025春节电商鏖战:“烧钱”... 撰文 | 张 宇 编辑 | 杨博丞 题图 | IC Photo 每年春节都是各大电商平台剑拔弩张、瓜...
原创 量... 绿色植物和其他光合生物是如何如此有效地传输太阳能的? 一项新的研究揭示了绿色植物和其他光合生物是如...
数智生活 “点亮”云南边境村寨 ● 本报记者 杨洁 5G+千兆网络支撑全村信息基础设施,一台电视机顶盒串联全屋智能健康设备,手握遥控...
勇探科技前沿 竞逐产业未来 光明科学城已进入设施建设和运营并行阶段。柳艳 摄 春潮涌动科学城,创新创业在光明。 在光明科学城大科...
科创向“新”行丨人力成本下降7... 浙江在线2月5日讯(记者 李心怡)“生产一条汽车轮胎需要多久?” “40秒!” 巨大的生产设备一列列...
销量十年来首次下滑,特斯拉打响... 马斯克争议言论、市场竞争加剧都导致销量下滑,如何守住销量、铺开自动驾驶等新业务是当下重任 文|《财经...
不跟OpenAI玩了,人形机器... 2 月 5 日消息,位于硅谷的机器人新创企业 Figure 今日通过社交平台 X 宣布终止与人工智能...
真我GT7竞速版来袭:骁龙8至... 近期,智能手机市场迎来了一则令人兴奋的消息,真我品牌即将推出一款专为游戏爱好者量身打造的“纯粹性能旗...