DeepSeek乱杀一通后,OpenAI们终于坐不住了。
创始人
2025-02-07 01:21:22
0

今年过年,年味浓不浓俺不好说,但 AI 味肯定是够够的了。

小到年夜饭桌,大到热搜新闻,哪哪都是 DeepSeek,就连世超家族群里平时不咋关注科技的亲戚,也在说中国的人工智能这次胜了老美一筹。

这么说吧, DeepSeek 凭一己之力,拉高了全国对 AI 的认知程度。

至于 DeepSeek 到底有多厉害,想必这段时间哥几个也已经上手体验过了,说它是 目前最懂中文互联网的 AI 模型,应该没人有意见吧?

反正从身边人统计学来看,这段时间什么 Claude 、 ChatGPT 通通都不香了。

不过大伙儿也先别急着开香槟,这次 DeepSeek 一冒头,对手们就从四面八方吻了上来。

OpenAI 大年初四发 o3 推理模型,今天又免费开放了搜索功能,谷歌的 Gemini2.0 全量开放,还有阿里的 Qwen2.5-Max 也发力打榜 DeepSeek 。。。

要我说,这些科技公司还是得逼一把,不然你都不知道他们的实力到底有多少。

先说 OpenAI 的 o3 ,去年底的发布会就传出了消息,说今年 1 月份要上线。

但奥特曼估计也没想到,被 DeepSeek 狙了一手,现在这个发布的时间节点,多少就有点耐人寻味了。包括世超也觉着, o3-mini 的发布是为了反击 DeepSeek 。

当然回到正题啊,这次的 o3-mini ,号称是他们的推理系列中最具成本效益的模型,还尤其擅长科学、数学和编码,响应的速度也更快。

一句话总结, o3-mini 就像一个家庭条件一般,但智商很高的理科学霸。

就拿编程来说,除了 o3-mini ( low )打不过 o1 以外, o3-mini 三个档位的模型,基本乱杀前辈 o1 系列。

竞赛数学也不在话下, o3-mini ( high )的表现都要好过 o1 系列。

就连博士级别的题目, o3-mini 也能跟 o1 系列打得有来有回。

x 上有老哥用同一组 prompt 测试了 o3-mini 和 DeepSeek R1 ,得出的结论是 “ o3-mini ( 编程能力 )碾压 DeepSeek R1 ” 。

说实话,光看视频的话,确实是 o3-mini 的效果更逼真。

另外一位老哥也测试了一把 o3-mini 的物理理解能力( prompt :编写一个球在超立方体内弹跳的 Python 脚本 ),直接夸 o3-mini 可能是物理学得最好的模型。

反正看了一波大伙儿的测试,世超觉着 o3-mini 似乎更接近咱们一直在说的,能够理解物理世界、模拟物理规律的世界模型。

重点是, o3-mini 现在免费就能用上,可比之前的 o1 要大方的多了。

而且, o3-mini 只是 o3 系列的第一个版本,后面还会有满血版的 o3 出来。我的建议是让 DeepSeek 再整个大活,给奥特曼上点强度,到时候指不定还会有大升级。

这不,除了发布 o3-mini 外, OpenAI 又趁着咱们开工的这两天,免费开放了 ChatGPT 搜索。

现在你甚至都不需要注册,就能直接用。

过年那阵,微软也让所有的 Copilot 用户免费用上了 o1 推理模型,要不说还得谢谢 DeepSeek 呢。

另外一边,谷歌也有点坐不住了。

同样是去年 12 月发布 Gemini 2.0 ,但那会儿只有开发者和一部分测试者能用,一直咕咕咕也不见有动静。

结果被 DeepSeek 这么一激, 一口气发了三个版本的 Gemini2.0 模型。

基准测试中,各方面性能也都优于前代模型。

但相比 DeepSeek 和 OpenAI 的热度,谷歌这边多少就显得有些无人在意了。

再来看国内的情况,阿里云算是第一个对 DeepSeek 发起 “ 进攻 ” 的公司。

根据阿里云官方的说法, Qwen2.5-Max 在多个基准测试中,超越 DeepSeek V3 、 o1-mini 等多个模型。

并且在 Chatbot Arena 的大模型盲测排行榜上, Qwen2.5-Max 冲到了第七的位置。

具体看模型的 数学和编程能力,甚至还能拿第一。

所以 Qwen2.5-Max 在发布后,国内有不少媒体都出来捧了一波。

反正世超看下来,这次由 DeepSeek 掀起的新一轮 AI 军备竞赛,领头的这一批公司已经掏出了不少真家伙。

不过说实在的, DeepSeek 这出后来者居上的戏码,的确给咱上了一课。

指不定后边儿还会有更加出色的模型出现, 毕竟有 DeepSeek R1 的珠玉在前,如果再不拿出点实力相当,或者足够炸场的东西来,那就没啥意思了。

咱们坐着等就成,今年的模型大战肯定有的看了。

撰文:西西

编辑:江江&面线

美编:萱萱

图片、资料来源

X、OpenAI官网

部分图源网络

相关内容

热门资讯

游戏测评!斗牛游戏在哪里找,微... 2TdqTeOPPO原来的系统确实做得一般,但是近几年已经有了很大的改善,流畅了很多,比如OPPO ...
大脑中或存在“饱腹指挥官” 来源:媒体滚动 科技日报北京2月5日电 (记者张佳欣)为什么人们吃饭时会突然觉得饱了?最近,美国哥伦...
游戏!牛牛房卡游戏平台加盟,牛... wK苹果手机虽然备受消费者的欢迎,同时也搭载的是自研的iOS系统,但是在很多方面,苹果也借鉴和参考了...
游戏推荐金花房卡价格表,金花房... LF两颗镜头的实际拍照素质也很强悍,不输安卓3000-4000档机型,打个有来有回还是可以的,同时i...
武汉大学:弘扬教育家精神 培育... 从冰雪精灵到双龙探极,从冰下湖泊到臭氧空洞,从南极探险到极地治理,从极地科研到极地科普……走进武汉大...
原创 无... 无人机、无人车送货,已经成为未来研发的方向,但美国人的活干得太糙了。 在2024年珠海航展上,中国的...
游戏推荐牛牛充值房卡,金花房卡... Jkwz0Y从相机配置来看,这款OPPO Reno10新机采用了后置四摄的设计方案,分别由一英寸大底...
游戏知识!牛牛卖房卡多少钱一张... LIe苹果公司计划在 iPhone 15系列中引入一种新的相机传感器,并将其命名为“ProRes视频...
原创 苹... 曾经,AR游戏一度异常火热,宝可梦go让多少人不惜翻墙都要去玩,但是也没过去几年,苹果被曝出再度砍掉...
hcie培训机构哪个好? 新盟教育 华为HALP授权培训合作伙伴 官方授权 培训学习更有保障! 最近好多小伙伴私信问我HCIE...
游戏介绍!牛牛怎么建房间,牛牛... vAUK在血雨腥风的手机市场,一款产品要想存活下来,就一定要有差异化的产品设计。摩托罗拉手机是一个大...
游戏斗牛房卡出售,正版房卡批发... XOa其实,苹果之所以能走到今天,就是因为它的技术和创新能力,除了系统和芯片之外,细节方面也在逐渐进...
海平面下1600米,精准投放! ◎ 科技日报记者 陆成宽 记者5日从中国科学院高能物理研究所获悉,来自该所、中国海洋大学和中国科学院...
游戏指南!牛来了房卡哪里买便宜... IgNMt这款OPPO Reno10新机内置了一块5500mAh大容量电池,支持150w超级快充,有...
游戏测评!正规房卡链接在哪购买... 873PT8EiPhone13内置3095mAh电池,支持20W有线+15W无线,别看电池容量比任何...
游戏推荐微信金花房卡链接怎么弄... 06G富有且慷慨!上述曝光的这款摩托罗拉X50mini,零下巴直面屏的全面屏的设计带来了令人惊叹的视...
4G/5G技术如何提升输电无人... 无人机巡检 在电力行业的快速发展下,输电线路的维护和巡检工作变得更加复杂和频繁。传统的巡检方式依赖于...
游戏介绍!微信链接房卡充值,牛... y强得有些离谱!上述曝光的这款realme GT3,更惊艳的极边微孔直屏的全面屏设计带来了赏心悦目的...
游戏金花房卡批发,微信房卡链接... 3jFKSDGC再加上直面屏的设计以及控制得相当合理的前置挖孔,因此整个手机正面的视频效果非常的赏心...
国家药监局:扩大药品电子通用技... 近日,国家药监局网站发布关于扩大药品电子通用技术文档实施范围的公告。一起来看! 国家药监局关于扩大药...