蛇年春节前夕,中国人工智能公司DeepSeek以低成本训练方式引领全球市场。该公司的出现可能重构具身智能行业竞争规则,推动通用机器人大模型发展。
DeepSeek的推理能力加快了机器人决策和响应进程,并使其更好地理解意图与背景信息。DeepSeek的技术若与机器人领域深度结合,可能推动机器人从“感知智能”向“认知智能”进化,同时加速其在更多垂直场景的落地应用。
目前披露数据显示,DeepSeek-R1在三维空间推理准确率达87.6%,跨模态意图理解F1值为91.2%。此开源模型有助于其他研究者验证和拓展方法,降低国产厂商训练成本并促进国内通用大模型成熟。
算力、算法、成本创新有望重新书写AI与机器人行业的游戏规则。
▍有趣的回答
记者试图让DeepSeek这个AI界的新贵锐评一下当前全球具身智能市场中的巨头,并解释其对于机器人行业的作用。
对于老牌机器人企业波士顿动力,DeepSeek说它是“技术殉道者的行为艺术”,并辣评“十年练就‘后空翻信仰’,工业界却只问‘能搬几箱货’?”“ 被现代汽车当AI花瓶供养,韩国高管看Atlas的眼神像看电子貔貅”。对于特斯拉的Optimus,DeepSeek则锐评它是“钢铁侠的赛博义肢”,称“马斯克承诺‘机器人比车早量产’,结果Cybertruck都生锈了Optimus还在跳机械舞”“被曝90%动作靠远程操控,堪称全球最贵提线木偶”。
在DeepSeek给出的海外具身智能巨头名单中,还有Figure AI和英伟达Project GR00T,DeepSeek分别点评其为“硅谷新晋PUA大师”和“黄仁勋的算力霸凌”。而国内企业方面,达闼、蔚来汽车人形机器人、大疆教育机器人、腾讯Robotics X等也出现在了DeepSeek的辣评名单中。可以看出,DeepSeek非常符合中文语境的特色,擅长具象化的对标形容。
在这份名单中,DeepSeek并没有点评同为新贵的宇树科技,经过记者的多次提问,DeepSeek给出了它对宇树科技的评价——“四足机器人界拼多多”。针对宇树机器人和机器狗便宜、开放C端销售的商业模式,DeepSeek给出的点评是“把波士顿动力Spot价格砍到脚踝,直播间喊出‘9块9上链接’的气势”“用消费电子套路玩B端产品,淘宝客服比工程师更懂机器人参数”。
DeepSeek与GPT一样,都能够助力机器人合成数据与仿真训练、自主学习和自适应优化、人机交互与情感理解等方面工作。例如DeepSeek可以利用生成对抗网络(GAN)或扩散模型生成逼真训练数据,生成式AI(如Diffusion Models)合成罕见场景数据,提升算法泛化能力,解决机器人视觉模型训练中真实数据不足的问题,如模拟极端天气下的场景等。
又例如借助DeepSeek能够实现虚拟仿真环境中,通过模型蒸馏等技术在低成本芯片上实现高性能计算构建高精度虚拟测试平台,加速机器人算法的迭代,如物流机器人在虚拟仓库中的路径规划训练,加速将已训练模型迁移学习快速适配到新场景,减少机器人部署成本,如农业机器人从果园到温室的环境适应。DeepSeek还可以基于自动化模型压缩技术帮助在机器人等嵌入式设备上部署轻量级AI模型,降低对高精度传感器的依赖,如扫地机器人的边缘计算,从而提升机器人对复杂环境的感知能力(如视觉SLAM、多模态传感器融合),使其在动态场景中实现精准定位与导航。
在人机交互过程中,DeepSeek还可以结合自然语言处理(NLP)和计算机视觉,实现机器人对人类意图的深度理解,让机器人通过强化学习(RL)优化机器人自主决策能力,让机器人在实际运行中持续升级视觉处理策略,如清洁机器人根据不同家庭布局自动调整清扫路径。或者基于交互对象的面部表情与手势识别,提升服务机器人对人类非语言信号的理解,如导览机器人识别游客的困惑表情并提供帮助等。这意味着结合视觉和语言模型,DeepSeek能帮助机器人实现更直观的人机交互。
DeepSeek的技术若深度融入机器人行业,可能加速机器人产品从“自动化”到“智能化”的转型,推动机器人从单一任务执行者升级为自主决策的协作伙伴,并在智能制造、智慧医疗、家庭服务等领域创造更大的社会与经济价值。
▍DeepSeek的背后
DeepSeek的创始人梁文锋,1985年出生于广东湛江吴川,父母都是小学语文老师,这也使得他从小就成绩优异。“湛江发布”提及他一段成长往事:梁文锋性格很文静,但不是书呆子,在学习上很有自己的“一套方法”,初中时就学完了高中数学,甚至开始学大学数学。
2002年,梁文锋以吴川一中“高考状元”的成绩考上浙江大学,本科就读电子信息工程专业,之后又继续攻读浙江大学信息与通信工程专业研究生。大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。
2015年,梁文锋硕士毕业后和几位浙大同学共同创立了量化对冲基金公司幻方量化,并于当年拿到第一张私募牌照,几年时间管理规模迅速超百亿。有意思的是,2016年幻方量化便首次上线AI策略,并在之后实现投资策略全面AI化,同时也是国内唯一宣称拥有万张英伟达A100显卡的企业。大学时期梁文锋便坚信“AI一定会改变世界”,这些都为后来投身AI埋下伏笔。
转折点是2023年,全球AI大模型风起云涌,国内大佬纷纷宣布AI创业,梁文锋也是其中一员。那年4月,梁文锋宣布正式进军通用人工智能领域,“追寻一直以来的技术理想,超越投资去直面更大的课题”。很快,DeepSeek在杭州应运而生——同年11月,DeepSeek 发布了开源的代码大模型。
成立至今,DeepSeek并未开放过外部融资,因此也并未引起创投圈的过多关注。直至2024年5月,DeepSeek发布DeepSeek-V2开源MoE模型,因极度降低推理成本,意外掀起一场大模型“价格战”,开始出圈。
隐秘低调,却聚集了一群AI天才。据悉,DeepSeek包括创始人梁文锋在内,仅有130多名工程师和研究人员。不同于其他明星创业公司,DeepSeek鲜有海归,团队成员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,不少还是在读博士。去年底,雷军开出千万年薪挖角DeepSeek研究员罗福莉。
这一次,DeepSeek正式浮出水面。上个月,梁文锋和团队开发的大模型DeepSeek-V3正式发布。起初在AI发烧友圈内流传,由于表现出色,一时轰动硅谷。1月20日,DeepSeek正式发布DeepSeek R1,开始席卷全球。
▍结语与未来
简单来看,DeepSeek R1在数学、代码、自然语言推理等任务上的性能,可以比肩OpenAI o1模型正式版。而DeepSeek R1被讨论的焦点,主要集中在低训练与使用成本以及开源两方面。区别于OpenAI“海量数据投喂”的方式,DeepSeek利用算法把数据进行总结分类,经过选择性处理之后输送给大模型,在提高训练效率的同时,也降低了DeepSeek的成本。
据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。以极低成本挑战了大厂们依赖巨额资本投资的模式。
“这可能是个国运级别的科技成果”,《黑神话:悟空》制作人冯骥激动评价,“这样震撼的突破,来自一个纯粹的中国公司。”
现在,DeepSeek还在招兵买马,在招聘平台上,DeepSeek正有超过50个岗位在招人,其中“深度学习研究员-AGI”一职月薪最高甚至达到11万元,年薪百万。
正如梁文锋所说,“中国 AI 不可能永远处在跟随的位置”,这一幕正在被一群中国年轻人实现。