DeepSeek现象背后:算法博弈与巨头焦虑
创始人
2025-02-04 20:01:36
0

来源:21世纪经济报道

21世纪经济报道记者孔海丽 北京报道

从2024年12月发布V3大模型,到最近推出R1模型和多模态模型Janus-Pro,DeepSeek持续出圈,形成了全球AI界甚至整个科技圈的“DeepSeek现象”。

多次采访马斯克等AI企业家的知名播客主持人莱克斯·弗里德曼(Lex Fridman),用了一个词叫做“DeepSeek 时刻”,“我认为 5年后它仍将作为科技史上的关键事件被人们铭记。”

DeepSeek出圈的原因之一是,它采用“更聪明”的算法,把AI训练成本砍掉近60%,却实现甚至超越了同类模型的性能。简单来说,同样的产品,别人花100块训练一个AI模型,它只要40元。这种“省钱打法”直接戳中了行业的痛点——过去拼的是谁能买更多高价芯片,现在比的是谁能把芯片用得更好。

DeepSeek不仅提供了新的AI技术路线,更重要的是,它在硅谷和华尔街联合主导的AI叙事铁墙上撕开了一道口子。

但自豪和兴奋之余,还是要保持清醒的头脑。且不说,在资金、技术、人才等方面,以DeepSeek为代表的新创AI企业,尚无法向OpenAI、Anthropic 这些巨头发起全面挑战,单单就V3、R1而言,其算法优化也有代价:处理复杂场景时,它的表现明显不如烧钱堆出来的大模型。就像用精简版PS软件修图——日常够用,专业场景会露怯。何况,短时间内我们还不足以撼动英伟达巨头们的硬件江湖。

摆脱硬件依赖尚不现实

在“DeepSeek现象”推动下,未来的算力图景,并非单一曲线绘就。

一方面,像DeepSeek这样的产品,更高流量、更低开发和消费成本,可能带来AI应用的突然爆发,这是所有从业人员梦寐以求的场景。

另一方面,当训练成本下降刺激更多公司入场,消费者应用呈指数级增加,催生AI生态链全面繁荣,芯片需求将迎来超乎预期的增长。

硬币两面,恰好构成了算力命题的悖论。

但是,业内人士援引腾讯之前发布的白皮书,AI Agent应用要实现跳跃式增长乃至爆发,必须闯过三关:场景渗透率大于15%、任务完成度大于80%、用户信任度大于60%。

仅以信任度为例,此前Gartner的一项抽样调查显示,64%的人表示,不希望在客户服务中使用人工智能。

目前AI Agent应用的技术能力仅满足简单场景,如客服、日程管理等。而复杂决策如医疗咨询、法律建议等,仍存在难以填补的缺陷。AI最大的应用场景是教育、医疗、金融等,但是,误诊率5%的AI医生看病,依然很难被接受。就好比,无人驾驶比人类更安全,但无人驾驶每出现一次事故都会被凝视。人类对AI的信任,只是处于初始水平,此外还面临着各国隐私保护法规、用户习惯、能源约束、技术路线分歧、多智能体协作、伦理困境等方面的挑战。

业内此前预计,要到2026年前后,才将出现AI信任度的分水岭(大于60%)。“DeepSeek现象”会不会加快这个时间表的到来?现在没有人能够断定。

有人说,2025年将是AI Agent应用元年。而DeepSeek通过异构计算架构、CPU+FPGA+ASIC混合部署和动态负载均衡算法等创新,将单位算力产出提升2倍多,这是否意味着它探索的技术方向将打破算力垄断,导致算力过剩?

这关系到算力现状。其特点是严重不均衡。一是地区不均衡。北美尤其是美国占据了全球算力最大份额,其次是中国,但高端算力基本集中在北美。

二是供应不均衡。通用算力芯片厂商主要是英伟达,占据70%以上份额,2025年其GPU销量预计可达700万块;BSIC芯片的主要厂商是博通和Marvell,合计占有超60%的份额;云计算方面,谷歌、微软、亚马逊占据全球65%的市场份额。这就是大家所说的算力垄断。

三是企业不均衡。微软、Meta、谷歌、亚马逊、xAI几大巨头目前囤积的算力总共约合355万块等效H100,这还不包括AI新贵OpenAI在内。其他经济体企业能拿到的芯片量,无法与之相比。

算力供需还存在结构性错配的问题。从纵向看,随着多模态应用的普及,推理侧的算力需求增速已经超过训练侧,但算力还主要布局于训练侧,调整需要一点时间;从横向看,大量算力被消耗在数据清洗和模型调试等非核心环节。

以大模型算力为例。2024年下半年以来,大模型算力已经从训练向推理转移,其中占据推理算力市场最大份额的,仍然是英伟达。

《中国算力发展报告(2024)》援引援引IDC报告,截至2023年四季度,英伟达全球市场份额达95.9%。英伟达通过在CUDA和GPU两端同时发力,构筑了软硬协同的护城河。有人说DeepSeek通过架构革新,绕开了CUDA,冲破了它的护城河,这其实是误读。多位专家研读DeepSeek公开(开源))论文后表示,V3、R1的底层架构仍然是基于CUDA生态建构。

在这种市场格局下,其他区域及其厂商要发起挑战,试图打破巨头垄断,摆脱以英伟达为代表的算力依赖,更多是乐观主义的展望式预期。除非量子芯片实现规模化商用,但那是5年甚至10年以后的事。

至于算力过剩,短期内不存在,整体上仍然是供大于求。《中国算力发展报告(2024)》援引中国信通院数据,截至2023年底,全球算力规模同比增长40%,但以CPU为代表但芯片年性能提升不足15%,无法满足视频、图片等非结构化数据的处理需求。赛迪智库2024年初测算,2023年中国智能算力需求达到123.6EFLOPS,但智能算力供给规模仅为57.9EFLOPS,严重供不应求。“DeepSeek现象”目前看来是增加了而不是减少了硬件需求。比如,32G的英伟达RTX50系显卡,近半个月涨势凶猛,最高已经炒到了6万元以上。其中部分原因在于,消费者购入RTX50显卡去做DeepSeek V3、R1本地化部署。

AI巨头为何焦虑

既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的创新,但为什么还是引起美国AI巨头的焦虑甚至恐慌?

从表层看,美国AI巨头嗅到了危机,不是因为技术被超越,而是实现目标的技术路径变了,新创企业有了更多选择。就像燃油车时代比拼的是发动机,电动车时代比拼的是电池管理技术。DeepSeek证明了硅谷堆硬件堆数据的路线不是唯一选择,高效用好现有资源同样能打。

DeepSeek省钱省力的R1模型发布时,刚好是OpenAI、软银、英伟达等科技巨头宣布5000亿美元算力基建——星际之门计划的时间段,放在这个背景下对比来看,美国AI巨头的刺痛感就更强烈了。

一位资深AI观察人士告诉21世纪经济报道记者,DeepSeek发起的这场“效率革命”,是AI发展从技术理想主义转向工程实用主义的标志性事件。它证明了,在现有硬件和物理约束条件下,通过计算拓扑结构优化获得的边际收益,远高于单纯增加芯片数量的线性增长。

这解释了为何美国AI巨头会产生战略焦虑的深层因素——当工程创新能力开始在AI竞争中脱颖而出,硅谷长期主导的技术先发优势就面临重估,而且它也将带来AI叙事的重估,背后是资本和资本市场的重估。

宏观趋势研究学者、经济学家David Woo近日接受访谈时表示,过去两年,人们一直在谈论美国经济的“例外主义”,而AI是推动这一论断形成的重要因素。美股市值占全球资本市场的份额达63%,其中ChatGPT出现后的两年,就增加了10个百分点,而七大科技巨头又占美股市值的25%。这些巨头正是依靠AI技术的强大优势巩固了它们的地位,从而间接巩固了美国资本市场的优势地位。

因此,AI与美国科技巨头、资本市场其实是捆绑在一起的,也正是硅谷和华尔街联合主导了全球AI叙事。

如今,来自东方的神秘力量DeepSeek向这套AI叙事发起了冲锋。全球科技和资本领域持续10多天的热烈反应,可以从侧面解释科技巨头的焦虑和资本市场为何如此紧张。

前述资深AI分析人士认为,DeepSeek创造的历史性价值有两点:一是力行开源,本质上是人类资源的共享表达;二是提供了碓砌算力和数据之外的新的技术路径。记者这几天的采访发现,DeepSeek以上两点价值,基本已成为业内的共识。

在现实层面,DeepSeek耶揭示了一个残酷的真相:当创新进入深水区,工程能力比学术突破更重要,成本控制比参数竞赛更致命,社会接受度比算法精度更关键。

如果跳开地缘政治谁赢谁输的问题,仅仅着眼于行业本身,商业本质在于,赚钱的公司才能活下去。当资本泡沫退去,或许我们会发现,技术强大固然重要,但应用和生存才是企业当下的现实,也是所有AI企业的必答题。

从 “谁能烧钱造最大模型”,过渡到“谁能用最少钱办最多事” ;美国依然掌握着最先进的芯片,但中国找到了更省钱的玩法——这才是DeepSeek重新书写的AI叙事。

相关内容

热门资讯

DeepSeek现象背后:算法... 来源:21世纪经济报道 21世纪经济报道记者孔海丽 北京报道 从2024年12月发布V3大模型,到最...
原创 在... 人类离地外生活越来越近了,但在月球或火星上维持生命需要一种关键的资源:水。 来自加州大学圣地亚哥分...
SuperCLUE:2024年... 自2022年11月30日ChatGPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智...
正泰取得热磁式脱扣机构及断路器... 金融界2025年2月3日消息,国家知识产权局信息显示,浙江正泰电器股份有限公司取得一项名为“热磁式脱...
OpenAI :不起诉 Dee... OpenAI首席执行官山姆·奥尔特曼在日本东京采访时表示, OpenAI无意起诉中国AI初创企业De...
无锡创信航取得多通信综合测试仪... 金融界2025年2月4日消息,国家知识产权局信息显示,无锡创信航电子科技有限公司取得一项名为“一种多...
百亮光电取得防水接线盒专利,提... 金融界2025年2月4日消息,国家知识产权局信息显示,东莞市百亮光电科技有限公司取得一项名为“一种防...
2025年新疆无人机执照培训指... ——聚焦新疆保华润天航空无人机培训中心的专业赋能 随着低空经济的加速发展,无人机技术正成为推动新疆产...
原创 华... 华为曾经因芯片供应受限而面临挑战,如今在芯片供应恢复后展现出了惊人的复苏力,令人没有想到的是,华为手...
原创 英... 2月3日消息,在2024年第四季度的财报电话会议上,英伟达联合首席执行官Michelle Johns...
耳朵里面经常痒,却掏不出东西?... 声明:本文根据权威资料结合个人观点撰写,为原创内容,文末已标注文献等相关信源,在今日头条全网首发72...
中国平台,集中上线 据中国基金报2月3日报道,近日,百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平...
DeepSeek,传来两大重磅... 来源:证券时报网 DeepSeek又有大消息传来! 今天早上外媒报道称,OpenAI总执行长奥特曼3...
信利光电取得一种穿戴产品显示组... 金融界2025年2月3日消息,国家知识产权局信息显示,信利光电股份有限公司取得一项名为“一种穿戴产品...
百度、腾讯、华为等云厂商宣布接... 2月3日百度智能云宣布,DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架...
重庆大渡口惠耳助听器:儿童助听... 小孩助听器一般需要一直佩戴,但也需要循循渐进,对助听器逐渐适应,刚开始佩戴时,需在医生指导下进行使用...
桂林电力电容器取得高电压脉冲电... 金融界2025年2月3日消息,国家知识产权局信息显示,桂林电力电容器有限责任公司取得一项名为“一种高...
研越科技取得防摔工业电脑专利,... 金融界2025年2月3日消息,国家知识产权局信息显示,深圳市研越科技有限公司取得一项名为“一种防摔工...
赛默飞3111二氧化碳培养箱 赛默飞3111二氧化碳培养箱(Thermo Scientific CO₂ Incubator 311...
原创 C... 据《财富》杂志官网近日报道称,主要面向人工智能(AI)推理任务应用的晶圆级AI芯片厂商Cerebra...