DeepSeek很强,但还不是革命?马斯克发声:很快会发布比Deepseek更好的模型
创始人
2025-02-11 04:21:11

图片来源:Pixabay

Deepseek的横空出世,无疑在全球AI领域掀起了一场风暴。该产品不仅在国内一直霸榜,还成功超过谷歌旗下的Gemini,成为全球第二受欢迎的AI聊天机器人。如此优异的表现吸引了全球各路人马的眼光,其中就包括特斯拉CEO马斯克。

日前,WELT经济峰会发布了马斯克采访视频,其中提到了大火的国产大模型DeepSeek。马斯克首先对中国工程师点赞,并指出中国拥有大量聪明且非常有上进心的工程师,所以应该预料到中国可以做出很多伟大的东西,DeepSeek只是这些伟大造物之中的一个,这其实是中国人才济济的结果。

但尽管如此,马斯克依旧认为Deepseek不能算作AI领域的一次革命性突破,在他看来,xAI(马斯克旗下AI公司)和其他AI公司很快就会发布比Deepseek更好的模型。

有着类似观点的科技大佬,不止马斯克一人。谷歌旗下人工智能实验室DeepMind首席执行官、2024年诺贝尔化学奖得主德米斯·哈萨比斯(Demis Hassabis)也在近期对DeepSeek作出点评。

哈萨比斯先是强调,Deepseek的AI模型可能是“我见过的来自中国最好的作品”。但随后他又指出,尽管Deepseek的模型展示了出色的工程能力,但从技术角度来看,这并非一项重大的变革:“Deepseek的模型并未带来新的科学进展,而是使用了已知的人工智能技术,外界对其的炒作可能‘有点夸大了’。”

哈萨比斯还称,谷歌上周向公众发布的Gemini 2.0 Flash模型要比Deepseek的模型更为高效。

事实上,任何一项新的技术突破在推动边界的同时,也会暴露出新的问题,并因此面临质疑。两年前,在ChatGPT横空出世,并以其惊艳的语言理解能力引发全世界关注的时候,也有类似的观点出现。2023年初,Meta首席人工智能科学家杨立昆(Yann LeCun)也曾在一次小型媒体和高管在线聚会发表了自己的看法,他认为ChatGPT并没有什么特别的创新,也不是什么革命性的东西。

但事后回看,ChatGPT的出现无疑为人工智能产业的发展带来了新的范式革命,自那之后整个产业都在向生成式AI迁移。

而以极低成本出圈的Deepseek,或许也有望创造同样的神话。

公开资料显示,Deepseek成立于2023年5月,至今不到两年,其背后是国内对冲基金巨头幻方量化。2024年5月,Deepseek发布开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被开始称作“价格屠夫”“AI界的拼多多”,吸引市场广泛关注。

2025年1月,Deepseek推出的R1模型,更是在数学、代码、自然语言推理等任务上与OpenAI-o1-1217基本持平,尤其在AIME 2024(美国数学邀请赛)、MATH-500、SWE-Bench Verified(软件开发领域测试集)三项测试集上以微弱优势取胜。

而这一切,是在不到600万美元的投入下完成的。这种“四两拨千斤”的模式,颠覆了人们过往对大模型行业“大力出奇迹”式的固有认知,也有望为整个大模型产业的落地提供新的加速器。

(时代财经谢斯临 综合自财联社、界面新闻、新智元、IT之家、经济观察报等)

本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com

相关内容

热门资讯

“老小孩”玩具如何征服“银发族...   新华网记者 潘子荻   老年大学“一课难求”、银发旅游列车穿越山海、养老机器人正加速走进现实生活...
和讯投顾华飞凡:可回收航天器成... 为什么说商业航天可回收这一概念或将继续演绎? 就在2月7号,酒泉卫星发射中心长征二号f运载火箭一飞冲...
“深圳市先进数据要素研究院”揭... 深圳商报·读创客户端记者 刘娥 2月7日,由深圳市先进数据要素研究院主办的“2026深圳跨境数据流通...
北方国际获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示北方国际(000065)新获得一项实用新型专利授权,专利名为“...
Workday首席执行官埃申巴... 来源:环球市场播报 核心要点 Workday 首席执行官卡尔・埃申巴赫即刻卸任。 公司联合创始...