364元就能开发DeepSeek模型?假的!
创始人
2025-02-08 00:01:35

近日,一则“炸裂”的AI新闻引发全球关注。

斯坦福大学和华盛顿大学的研究人员发表的一篇研究论文显示,他们以不到50美元(约364元)的云计算费用,训练出一款名为S1的推理模型。该模型在数学和编码能力测试中,与OpenAI的o1和DeepSeek的R1表现不相上下。

这是AI领域的又一次重大突破吗?事实并非如此。

根据研究论文,S1模型并不是从零开始训练,而是以阿里通义千问Qwen2.5-32B开源模型为底座,然后在16块H100 GPU上进行了26分钟的监督微调,最终训练出新模型S1-32B。

在推理能力方面,研究人员则通过蒸馏技术,从谷歌的AI推理模型Gemini 2.0中提取了推理能力。

某大模型厂商的研发人员告诉21世纪经济报道记者,S1模型本质上是在前人研究的基础上复制了推理能力,而非真正创新。

但S1模型的出现,也为头部大模型厂商敲响警钟。如果头部大模型厂商投入巨大资源训练出来的模型,其他人用极少的资源就能复制并实现相似的能力,那头部厂商的“护城河”究竟是什么?

相关内容

热门资讯

天下贰经典版让无数玩家重燃热血... 对,你没有看错!打个游戏竟然能领到“人才补贴”!这并非调侃或是整活,而是确确实实于近日发生在《天下贰...
打架搬砖就能赚米?还有什么理由... 你怎么知道我的童年女神复出了?而且代言的还是是陪伴了玩家 18 年的老牌国产 MMO IP《天下》。...
触乐怪话:质量上乘的小游戏 触乐怪话,每天胡侃和游戏有关的屁事、鬼事、新鲜事。 图/小罗 前段时间,我在《英雄联盟》客户端里看...
《恐鬼症》1.0版跳票延期至2... 自2020年进入抢先体验以来,合作恐怖游戏《恐鬼症》(Phasmophobia)的1.0正式版一直是...
原创 拼... 放眼整个2026年,拼多多的核心玩法依然离不开:强付费和自然流两种玩法。也就是,大家做拼多多,如果不...