成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
创始人
2025-02-07 10:42:39
0

在DeepSeek火爆全球之际,一个更低成本的AI推理模型悄然登场...

近日,一项来自斯坦福大学和华盛顿大学等机构的研究成果引起了市场关注,李飞飞等人以不到50美元的云计算费用成功训练出了一个名为s1的AI推理模型。研究成果表明,s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。

s1论文作者Niklas Muennighoff表示:

“DeepSeek r1令人兴奋,但缺少OpenAI的测试时间扩展图,并且需要大量数据。我们推出了s1,仅使用1K样本和简单的测试时间干预即可重现o1的预览扩展和性能。”

简单高效的训练方法,挑战传统AI研发模式

s1的研究团队表示,s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental为基础模型,通过蒸馏法提炼出来的。

他们采用了一种名为test-time scaling的方法。研究团队构建了一个小型数据集s1K,通过难度、多样性和质量三个标准来筛选,其中包括1000个经过精心挑选的问题以及相应答案,并附上了“推理”过程,仅使用了16台英伟达H100 GPU,耗时26分钟就完成了训练。

这种方法与传统的大规模强化学习方法(RL)形成鲜明对比,后者的成本通常较高,DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调(SFT)蒸馏推理模型,大大降低了训练成本并提高了效率。

此外,为了提高答案的准确度,研究团队还运用了一种“预算强制”技术,可以控制测试时间计算,通过强制提前终止模型的思考过程,或在s1推理时多次追加“等待”指令以延长思考,从而优化性能。

研究显示,新模型s1-32B在使用该技术后,性能与测试时的计算资源成正相关。

性能媲美顶级模型,引发行业关注和担忧

根据研究团队的测试结果可知,在竞赛数学问题上,s1-32B的表现较o1-preview高27%(MATH和AIME24);且该模型在AIME24上的表现几乎与Gemini 2.0 Thinking API相当,显示其蒸馏过程是有效的。

而s1的出现也引发了行业的担忧。此前,OpenAI曾指控DeepSeek不当使用其API数据进行蒸馏。

有分析人士质疑,如果任何人都可以轻易复制和超越现有的顶级模型,那么大型AI公司多年的研发投入和技术积累可能会受到威胁。而且,尽管蒸馏技术在以较低成本复现AI模型方面表现出色,但其对新AI模型性能的提升效果并不显著。

相关内容

热门资讯

游戏指南!牛牛房卡批发价格,微... HsEYFmp9独家:iPhone 15 Plus 渲染图揭示新设计独家:这是 iPhone 15 ...
离石移动:开工盲盒欢乐多 共启... 新年伊始,万象更新。春节假期的喜庆氛围尚未散去,吕梁离石移动公司的全体员工已精神抖擞地回归工作岗位。...
游戏!斗牛房卡购买联系方式,牛... 3FAht比如说iPhone 14Pro版的两款机型将采用全新的ID设计,即网友所说的“感叹号”打孔...
涉DeepSeek,谷歌CEO... 据日本《日经亚洲新闻》2月5日报道,谷歌首席执行官桑达尔·皮查伊和美国超威半导体公司(AMD)首席执...
爱柯迪新设机器人技术公司,布局... 近期,瞬动机器人技术(深圳)有限公司正式宣告成立,其法定代表人确定为张恂杰,公司注册资本高达500万...
游戏测评!牛卡批发价格,微信金... vPw用户对苹果的刘海屏是很有意见的,说到底是视觉疲劳了,多年不变的设计,确实是有点说不过去了。在i...
日本Rapidus 2纳米芯片... 日本创业公司半导体公司Rapidus近期似乎有很大进展,《Nikkei Asia》报道该公司将于今年...
原创 一... 行星撞地球的事件可能真的要发生了,为此,联合国首次启动了一项协议。据《环球时报》援引海外媒体报道,这...
Intel携手日本AIST,2... 英特尔(Intel)近期宣布了一项重大合作计划,携手日本产业技术综合研究所(AIST),致力于研发下...
游戏指南!微信大厅房卡充值,微... kZ在交互体验上的表现,iPhone14ProMax依然是处于领先的水准。虽然华为P60Pro的微四...
游戏!怎么在微信上玩斗牛,正规... Pz.延续了几代的刘海屏也将会被抛弃,采用了全新的“感叹号”屏。以前一直觉得iPhone产品的刘海屏...
DeepSeek培训课 有必要... 【文/财圈社&道哥说车 张浅】该说不说,每当新技术出现,就有人想抓住风口实现财富自由。 日前,伴随着...
为何要优化重大科技创新组织机制 在科技日新月异、一日千里的今天,人们越发认识到科技创新对经济社会发展的重要性,科技创新对发展新质生产...
震撼全球的国产AI Deeps... 文/星灭山上一白妖 转眼春节假期又结束了,大伙该返工的也都返工了。 要说今年过年期间经常聊的话题,除...
【前瞻分析】2025-2030... 科学仪器行业是科技创新的关键支撑领域,在现代社会扮演着举足轻重的角色。它涵盖各类用于科学研究、质量检...
突发!o3-mini思维链公开... 新智元报道 编辑:编辑部 【新智元导读】OpenAI实属急了,刚刚官宣公开o3-mini思维链。令...
游戏牛牛科技房卡多少钱一张,金... cdbuKAyd并且,据悉该机内置了5560mAh电池和150W超级闪充技术,同时最高内置了18G运...
游戏推荐金花牛牛房卡批发,牛牛... cCeo4当然,行业在发展,相信在接下来realme手机会再接再厉,为行业带来更有竞争力的产品。网上...
Switch 2新玩法揭秘:J... 【环球网科技综合报道】近日,任天堂公布的一项新专利引发了游戏界的广泛关注。据外媒2月7日报道,根据专...
苹果台灯机器人被曝:或成未来智... 【环球网科技综合报道】据外媒2月7日报道,苹果机器学习研究网站日前发布的一篇博客文章,揭示了苹果正在...