智通财经APP获悉,国盛证券发布研报称,随着RL算法在预训练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,基于RL算法训练模型生成思维链,将共同构成AI新的Scaling Law,算法创新与算力堆叠在这条曲线上将一起狂奔,AI的能力边界将迎来新一轮的扩张。春节假期中,除了DeepSeek之外,还发生了北美关税落地等事件。结合市场对于DeepSeek的边际变化的认知更多反应在应用端的快速放量上,因此节后主要的进攻方向主要聚焦在端侧以及国产替代链上。
而从中长期来看,通信、能源等全球算力配套产业链也将迎来全新的发展期,节后方向建议关注:端侧:物联网模组龙头,美格智能(002881.SZ),移远通信(603236.SH),广和通(300638.SZ);国产替代:寒武纪-U(688256.SH),中芯国际(688981.SH,00981),中兴通讯(000063.SZ)。
国盛证券主要观点如下:
DeepSeek做了什么
验证了新的Scaling Law:在过去的几年间,AI模型的增长主要依靠于预训练阶段的规模堆积,通过对人类已有数据的不断积累,从而增加模型的规模和能力。但随着训练耗尽了人类已有数据,叠加合成数据之路所产生的幻觉和边际收益递减问题,预训练阶段的Scaling Law逐渐放缓。
2024年以来,基于强化学习的新Scaling Law成为了行业重点方向,先后涌现出了GPT-o1,Deepseek R1等优秀模型。RL这种新的AI增长曲线,在初期展现出了非常高的投入性价比,这也是Deepseek V3快速进化到R1,并展现出强大能力的根本原因。当下RL依然是基于传统的预训练模型,在推理阶段加入RL使得模型面对理科问题时的推理技能更加强大。
展望未来,随着RL算法在预训练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,基于RL算法训练模型生成思维链,将共同构成AI新的Scaling Law,算法创新与算力堆叠在这条曲线上将一起狂奔,AI的能力边界将迎来新一轮的扩张。
极致的工程优化:DeepSeek的真正创新之处在于极致的工程优化,主要依靠了如键值缓存,创新型的MoE架构,以及基于PTX层汇编语言实现对于英伟达GPU效率的极致压榨等等,通过这些创新性的工程优化,使得DeepSeek打破了西方模型公司固有的降本周期曲线,能够用更低的价格,来提供接近头部模型的使用体验,提高了全球算力的使用效率。
慷慨的开源:与西方以OAI和Anthropic为代表模型巨头,逐渐走向闭源的模型商业理念不同,DeepSeek将自身创新性原理和模型进行了开源,一方面使得全球模型厂商能够共享新的工程方法带来的性价比提升,另一方面使得全球用户能够本地或者通过公有云部署,从而避免高溢价,这也是Deepseek在全球开发者中获得如此高殊荣的核心原因。
DeepSeek对于英伟达的影响
Deepseek的出现,让全世界看到AGI的实现又更近了一步。国盛证券认为,海外在算力领域的布局不会因为deepseek有所放缓,相反,因为deepseek的出现,将会给全球科技巨头进一步上紧发条,海外科技巨头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一步加大英伟达GPU采购力度,另一方面也会加紧推进自研ASIC方案的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力层面上进行最后的封锁,以限制其他国家地区的AI发展,维护其所谓的AI领先地位。
对于英伟达而言,国盛认为,deepseek的阶段性胜利,将继续推动算力市场的整体需求,长期的天花板进一步被打开,不认为英伟达的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,性能有望实现重大突破的极具创新型技术路线(如CPO、OIO等),有望继续提速。英伟达的股价下跌并非反应的是需求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而带来的不确定性。
DeepSeek对于中国算力投资的影响
对于国产算力:DeepSeek推出后,美国迫于竞争压力,对于中国进一步加强算力制裁的呼声愈发强大。同时由于DeepSeek开源和低成本特性,国产显卡用于推理的性价比和ROI急剧上升,至此,基于中芯国际的制造能力,芯片厂商的设计能力,Deepseek模型的应用能力三者合一,中国算力自主可控的飞轮开始旋转。
对于边缘侧:DeepSeek对于边缘侧的拉动主要有两点,第一是云端先进模型的价格降低,使得AI应用,AI硬件的使用和开发运营成本降低,这将促进AI硬件的放量。第二是DeepSeek对于小模型优化的能力,此次Deepseek也基于Qwen与Llama发布了部分优化后的小模型,能力相较于此前小模型有一定提升。随着RL这一新增长曲线的不断放量,叠加边缘侧算力的提升,边缘推理将加速变为现实,边缘算力有望加速放量。
Deepseek对于全球算力投资的影响
GPU:deepseek对GPU的影响是积极的,因为目前无论从训练还是推理的角度,GPU的优势的非常明显,算力长期来看依旧将继续指数级增长,依旧看好英伟达在AI基础设施领域的确定性优势,同时看好其在能够大幅度提升性能的新技术领域的加速,看好CPO、OIO的加速落地,建议关注:天孚通信、康宁、太辰光等。
ASIC:强化学习对推理的积极影响,可能会加速大模型团队及云厂商对于推理以及自研算力的需求和进展,最终市场取决于单位算力成本的比较,目前来看英伟达在推理领域依旧有着明显的优势,但云厂商可能会继续冒着支出更多的代价,坚定推进自研算力。利好云厂商的ASIC合作伙伴,以及其配套产业链:博通、amd、mrvl、arista、cls、中际旭创、新易盛、cohr、lite等。
通信:deepseek对通信的影响比较综合,通常训练集群通信要求相较于同等规模的推理集群更高,但考虑到性价比问题,目前众多训练集群也兼顾了推荐算法、推理、科研、金融交易等其他功能,训练集群依然将坚定的向着规模更大的方向发展。同时,推理需求需要考虑规模效应,预计云厂商主导的推理市场依旧将占主导地位,端侧目前算力有限,不构成太大影响,预计推理集群也将延续过去发展趋势。