如果说 2023、2024 开年科技行业最重要的新闻分别是 ChatGPT 和 Sora,那 2025 开年科技行业最重要的新闻毫无疑问就是——DeepSeek(R1)。
只看一点,从国内到海外,不断有科技互联网公司宣布接入甚至基于 DeepSeek 开发产品。其中虽然有不少是出于「蹭热点」的营销,但更多厂商也确实是看到了 DeepSeek R1 的巨大潜力,包括看似关系不大的人形机器人厂商。
2 月 7 日,作为国内人形机器人第一股,优必选官方就表示公司正在人形机器人应用场景中验证 DeepSeek 技术的有效性,如多模态人机交互、复杂环境中的指令理解、工业场景中的任务分解与规划等,「有望利用推理大模型的深度思考能力解决这些复杂任务中的挑战,让人形机器人更加接近人的思考和行为表现。」
优必选可能并非个例。
就在两天前,一度引起全球科技圈集体关注的硅谷人形机器人公司 Figure,创始人 Brett Adcock 突然在 X 平台上宣布决定终止与 OpenAI 的合作,并转向内部自主开发端到端的机器人 AI。
图/ X
Brett Adcock 还透露,Figure 目前已经取得「a major breakthrough(重大突破)」,将在接下来 30 天展示一些从未在人形机器人上见过的东西。考虑到最近一段时间人工智能行业最大的变化就是 DeepSeek 的开源模型,很多人认为 Figure 是在基于 DeepSeek R1 等开源模型进行开发机器人 AI。
甚至,打造出白菜价人形机器人的宇树科技也传出了与 DeepSeek 达成深度合作的消息。而更多的人形机器人厂商,或许都在思考和谋划基于 DeepSeek 模型的新路线,就像优必选一样。
但不管是或不是,DeepSeek 正在改写的 AI 叙事,似乎不可避免将改变人形机器人的故事方向。
优必选和 Figure 的「转身」,并非偶然。事实上,DeepSeek 的出现,恰好击中了当前人形机器人的痛点,首当其冲的就是「成本」。
了解人形机器人研发的人都知道,训练一个具身智能的机器人,需要消耗大量的算力。而算力,意味着真金白银的投入。科技巨头之所以能在人工智能领域呼风唤雨,除了技术领先外,更重要的是它们有足够的财力支撑起「天价」的算力支出。
但对于大多数人形机器人初创公司来说,高昂的算力费用无疑是一笔巨大的负担。另一方面,数据匮乏更是整个行业共同面临的困境,甚至 OpenAI 四年前解散人形机器人团队就是因为数据极其匮乏的难题。
这也是为什么去年年底智元机器人开源百万真机数据集 AgiBot World,引起了广泛关注。
AgiBot World 数据集在 GitHub,图/雷科技
智元机器人联合创始人、首席技术官彭志辉(稚晖君)就提到,具身智能领域,真机数据的采集成本和门槛非常高。但实际上,「百万真机数据集」在一些业内人士看来也只是杯水车薪,「只能训练一个动作的泛化,譬如分拣,对实现理想状态中的具身智能还远不够。」
这就像一个有天赋的运动员,却苦于没有训练场地和器材,最终也只能泯然众人矣。但 DeepSeek R1 的出现,却很有可能改变了这一切。
最直接的一点就是 4 元/百万 tokens(缓存未命中)、1 元/百万 tokens(缓存命中)的输入价格和 16 元/百万 tokens 的输出价格,让 DeepSeek R1 在推理成本上的优势一览无遗。
图/ DeepSeek
与之相比,OpenAI o1 正式版的 API 价格分别是 55 元、110 元、438 元。仅这一点,就能让人形机器人公司终于可以摆脱「天价」算力的束缚,将更多的资金投入到机器人本体的研发中,加速产品的迭代和升级。
当然,根本还在于 DeepSeek R1 作为性能上与 OpenAI o1 比肩的顶级推理模型,可以低成本地提供强大的数学、代码以及自然语言推理等能力,正如优必选所期望的——改进人形机器人面对复杂任务的指令理解、任务规划和分解,「让人形机器人更加接近人的思考和行为表现。」
不单如此,DeepSeek R1 的一大优势还在于算法的改进和优化,不像以前要求那么大的数据量。一方面是基于数据蒸馏实现自动筛选高价值数据,同时也通过对抗训练生成合成数据,将高质量代码数据获取成本从每 100 个 tokens 的 0.8 元降低至 0.12 元。
DeepSeek-R1 的官方新闻稿中也提到了,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,「在仅有极少标注数据的情况下,极大提升了模型推理能力。」
图/ DeepSeek
这对于困于数据难题的具身智能来说极具重要性,实际上也为整个具身智能领域指明了方向。更何况,DeepSeek-R1 还是开源的,允许开发者和厂商自由修改、蒸馏。
换言之,所有人形机器人都可以基于 DeepSeek-R1 开发更适合自己的顶级推理模型,甚至沿着 DeepSeek 的技术路线重新训练真正属于具身智能的模型。尽管很难直接横向对比,但在整体性能比肩 OpenAI o1 的同时,DeepSeek R1 毋庸置疑大幅降低了顶级模型的训练成本。
今天打造一款人形机器人,最重要的技术就在于机电和大模型,如果说前者对应「身体」,后者则是对应「大脑」。
而除了「成本」之外,技术的自主性也是制约人形机器人发展的一大因素。一般来说,此前人形机器人厂商要么是自主开发模型,要么就是选择与 OpenAI、Google、科大讯飞、华为等大模型厂商合作。最典型的例子就是 Figure 与 OpenAI 的合作。
其实不难理解合作的方式,自主开发的问题在于训练成本高昂,技术上也难以追赶领先的 AI 巨头。不过与此对应的是,选择合作也意味着在技术上的依赖,不仅需要面对不菲的推理成本,更重要的是模型适配度、开发节奏上受制于大模型厂商。
Figure 02 在宝马工厂,图/ Figure
DeepSeek 的开源策略,则为人形机器人公司提供了新的选择。通过开源,DeepSeek 让人形机器人公司可以基于其模型进行二次开发,构建自己的技术闭环,真正掌握核心技术的主动权。
开源意味着越来越多的机器人可以直接使用先进的 AI 技术,而不必从零开始开发自己的解决方案。对于优必选、Figure 等人形机器人厂商而言,这种技术门槛的降低意味着可以将更多资源集中在硬件开发和实际应用的优化上。
尤其是 DeepSeek 的出现让更多人形机器人厂商看到了自主研发的优势,不仅是成本和技术门槛的大幅降低,还能定制自己的大模型,同时构建技术闭环。
还是以 Figure 为例,之所以与 OpenAI 分道扬镳,直接的一个原因可能在于 OpenAI 早就被曝光内部也在自研人形机器人。可以预见的是,相比 Figure 这种参股的「干儿子」,OpenAI 在开发模型上无疑会更重视自家的「亲儿子」的需求和发展路线。
然而更深层的问题在于,Figure 始终还是会受制 OpenAI 的技术路线、成本等,如果继续合作很可能面临成本上的巨大劣势。反过来,得益于 DeepSeek 等开源模型的强大和经济,不仅在综合成本可能还有优势,更重要的是能够构建自主的技术闭环,适配自身的迭代路线和产品节奏。
不仅是 DeepSeek-R1,在很多人还震撼 R1 超高性价比之余,并不知道 DeepSeek 这几天刚提出了一个全新的视觉语言模型——DeepSeek-VL。
DeepSeek 新论文,图/ DeepSeek
虽然目前仅公开 1.3B 与 7B 两个版本的模型,但 DeepSeek-VL 追求的基于现实场景的领先性能,同时多次强调保留强大的「语言能力」——这一点可能被很多大模型和人形机器人厂商都忽略了。
DeepSeek 团队在论文中就强调,「在训练过程中,我们不仅进行多模态数据训练,还将大量语言数据纳入训练。」
但这条技术路线的正确与否,最终还是要「实践出真知」,就像 DeepSeek-R1 一样。不过对于人形机器人厂商来说,在 DeepSeek-R1 之外,DeepSeek-VL 确实可能成为了人形机器人加速走向落地的 One more thing。