月之暗面或因DeepSeek调整工作重心,强化学习成关注焦点
创始人
2025-02-17 02:21:48

钛媒体App 2月15日消息,据悉,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,他们计划在模型能力方向上加强多模态和长文本推理能力。然而,DeepSeek的成功让外界重新审视了月之暗面的技术和用户增长模式。两者在闭源与开源、预训练与蒸馏技术等方面存在差异。虽然尚未明确是否接入DeepSeek或开源,但有业内人士透露可能会将强化学习作为一个工作重点方向。此举被认为是对抗DeepSeek等竞争对手的一种改变或尝试。

近日OpenAI发布研究论文报告《Competitive Programming with Large Reasoning Models》,提到中国的DeepSeek-R1和Kimi k1.5利用思维链学习方法,在数学解题与编程挑战中表现出色。这也进一步引发了对于强化学习路线带来的模型能力提升的关注。

相关内容

热门资讯

《魔兽世界》周年服:TBC P... 《魔兽世界》周年服TBC P2“外域霸主”于5月15日正式上线,两大团本风暴要塞和巨蛇神殿现已开放,...
从美墨狂飙到岛国追梦 《地平线... 在从美国一路驰骋到墨西哥、领略无数风土人情后,地平线嘉年华的举办地,终于来到了这个无数赛车文化爱好者...
比算力先爆炸的,是米哈游AI的... 最近,米哈游《崩坏:星穹铁道》的“帕姆帮帮”(测试版)AI又怒刷了一波存在感。 据官方发布的“帕姆帮...
AI知识库进化后,知乎可能正在... 最近NotebookLM火了。 很多人把它当成一个AI笔记工具来看,我觉得看浅了。它真正厉害的地方,...
618高端折叠屏手机推荐:三星... 618大促是入手高端折叠屏手机的最佳时机,高端机型不仅代表顶尖工艺与配置,更能带来长期稳定的使用体验...