华为芯片或将撕开算力铁幕!
DeepSeek最新发布的消息显示, 华为的Ascend 910C芯片性能竟然达到了NVIDIA H100的60%!
这一数字或出乎所有人预料。
DeepSeek团队的实测数据显示,在推理任务中,华为910C芯片的表现出乎意料地好。 并且,若通过手写CUNN内核和优化,性能还能进一步提升!
这个成绩意义重大。
要知道,华为是在被严格限制的情况下取得这样的成就。这不仅展示了中国芯片制造的实力,更是预示着AI芯片格局或将发生重大变化。
DeepSeek的支持为华为芯片带来了关键优势:
从第一天起就支持华为Ascend芯片
自主维护PyTorch仓库,只需一行代码就能将CUDA转换为CUNN
性能优化潜力巨大,通过定制优化可达到更高性能
更值得注意的是,这款芯片是由中国的半导体制造商中芯国际(SMIC)使用 7nm工艺制造,采用 chiplet封装,集成了 530亿晶体管。
在《芯片战争》一书中,作者克里斯·米勒详细描述了全球芯片产业的复杂供应链:
欧洲ASML的紫外光系统是芯片制造的关键
德国蔡司的精密光学系统不可或缺
欧美和东南亚的自由市场确保了供应链的畅通
而中国被排除在这个供应链之外。
按照常规路径,中国要建立类似台积电的生产设施, 预计需要15年时间。
但现在,华为用实力证明: 即便是在重重限制之下,依然可以突破重围。
虽然@immanuelg 指出: 「Transformer不会是AGI的终极架构」,但当模型架构趋于Transformer统一, 手工优化特定算子的价值被无限放大。
这也印证了@manjimanga的观察: 中国可能通过AI驱动设计直接跳过传统制程竞争。
但训练领域仍是英伟达的绝对主场。
Yuchen Jin坦言:
「长周期训练的稳定性是中国芯片最大难关」。
这涉及到芯片底层架构与软件栈的深度融合,CUDA生态二十年的护城河不会轻易崩塌。
有专家预测:
随着AI模型架构向Transformer收敛, CUDA和PyTorch编译器的重要性将降低
DeepSeek团队的加入将 显著降低对NVIDIA的依赖,大幅节省成本
训练领域仍然是一个挑战, 长期训练的稳定性是中国芯片需要突破的关键
华为的突围或许证明了一件事: 在算力铁幕下,没有退路就是最好的出路。
华为能否在AI芯片领域掀起新的浪潮,你怎么看?