Google 深夜发布免费版 o1「暴打」OpenAI,实测解题快 3 倍,这句高情商回答绝了
创始人
2024-12-20 08:20:23
0

OpenAI 又是被抢头条的一天。

发布会前夕,Deepmind 抢先发布了与 o1 模型类似的 Gemini 2.0 Flash Thinking 模型,在大模型竞技场 LMSYS 上杀疯了。

而随后 OpenAI 发布会则重点展示了桌面版 ChatGPT 与 Mac 应用的深度集成能力。

可以说,桌面版 ChatGPT 正有望成为你最靠谱的生产力搭子。

抢先实测 Google 版 o1,效果大出所料

没有人比 Google 更懂「狙击」。

今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型,从名字上就可以看出,这是一款类似于 OpenAI o1 的推理模型。

转投 Google 阵营的 Logan Kilpatrick 在 X 平台上发文称:

「就在你以为一切都结束了的时候… 我们推出了 Gemini 2.0 Flash Thinking。

这是一种新的实验模型,可以解锁更强的推理能力并展示其思考过程,能够以闪电般的速度解决复杂问题,以及还有更多功能。

在大模型竞技场 LMSYS 上真·战绩可查。

当然,旁人说得再好,不如亲自上手体验。

我们也第一时间上手实测了这款新模型,先来「9.11 和 9.8 哪个大」的经典问题,结果新模型轻松拿捏,甚至还能用钱举例。

「strawberry 中有几个 r」也手拿把掐, 点开后还能看到其清晰的「思考」步骤。

面对职场分水难题「你有 4 杯水,来了 5 个领导你该怎么办?」,Google 版 o1 又会如何应对?满分十分,你给这个答案给几分?

向左内容

对于「有轨电车难题」的回答,除了前面有条不紊的回答,我更喜欢这位新选手最后一句高情商的回答:

「理解你的思考过程比得到一个『正确』答案更重要。」

向左内容

为了考察新模型是否「偏科」,我也上传了一道考研数学热门题,并让它和 OpenAI o1 模型同时作答。

省去繁琐的运算过程后,两者得出的结果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。

向左内容

当然,最好的评价还是亲自上手。附上体验地址 👇:

https://aistudio.google.com/prompts/new_chat

关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察

给 Mac 装上最强大脑,这才是真正的人机交互

在被抢头条后,OpenAI 也不慌不忙地如期举行了发布会。

全新桌面版 ChatGPT 将超越单纯的问答,能够通过与 30 多种应用协作来辅助提升你的写作和编程能力。

使用方式也十分简单,用户只需确保目标应用正在运行,然后在 ChatGPT 聊天栏中点击「与应用协作」(Work With Apps)按钮并选择相应应用即可。

聊天栏上方会显示当前协作的应用程序,用户可以随时查看 ChatGPT 将要处理的内容范围。 这些互动记录会保存在用户账户中,直到被删除或经过 30 天自动清除。

在实际演示中,OpenAI 工作人员通过 Mac 版 ChatGPT 展示了多项实用功能。

以 Warp 控制台为例,ChatGPT 能够根据演示人员要求快速生成 Git 命令来统计代码库的每日提交次数,并将其数据可视化为富有圣诞节气氛的柱状图。

在这个过程中,它正是充分使用了 Advanced Data Analysis(高级数据分析)等内置功能。

为保护用户隐私,OpenAI 演示人员表示只会访问用户明确授权的应用内容。

但在查阅 OpenAI 官网后发现,这些交互数据可能会被用于模型训练,因此你需要在设置中调整数据使用权限,甚至按需禁用应用协作功能。

「它还告诉我们这个文本字段有 37 行,我们可以向下检查确认是否是 37 行。」

有趣的是,演示过程再次上演翻车场面。

当要求 ChatGPT 添加「观察者」功能,选择变化加载文本区域时,o1 生成的代码在 Xcode 运行失败,直到修正过后才成功。

值得一提的是,这项功能不仅支持 Xcode,还覆盖了 VS Code、Jetbrains 全家桶等主流开发工具。

写作场景是日常最实用的场景之一。

Mac 版 ChatGPT 也将支持 Notes、Notion 和 Quip 等多款应用,为用户带来全新的写作协作体验。

作为旧金山徒步历史导览员,OpenAI 演示人员通过自己正在设计的导览项目生动展示了这些新功能。

比如说,在 Notion 文档中,他正尝试编写关于旧金山历史人物「诺顿皇帝」的介绍,但如何描述历史人物的生平,如何挖掘有趣细节等等都是一门不小的学问。

借助搜索功能,ChatGPT 能够 查证历史文献和研究资料,快速补充诺顿皇帝在旧金山的活动轨迹、与当地居民的互动等生平细节,并对其过往行为进行深入解读。

了减少 AI 的机器味,我们也能要求其模仿 Notion 文档中的语言表达方式和叙述节奏,对内容进行调整,使其更加流畅自然。

除了文本交互,ChatGPT 高级语音模式 还有新玩法。

作为一名职业萨克斯演奏家,OpenAI 演示人员还能与前不久刚推出的「圣诞老人」限定语音讨论节日派对曲目的选择。

演示人员还即兴演奏了一段动听的萨克斯乐曲。

目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上线,而 Windows 版本很快也会推出。 不妨再耐心等待一下。

发布会最后,OpenAI CPO Kevin Weil 还预告明天将会发布 「令人兴奋」的新产品。

Google、Anthropic 等公司面对年底最后一轮 AI 狂欢,是否又会再次放大招「狙击」?

一切都值得拭目以待。

APPSO 也将在明天凌晨第一时间送上最新报道。

相关内容

热门资讯

原创 不... 大家都知道最近几年几乎没有表现特别亮眼的新人,打来打去,几乎还是那几位老人。要说最优秀的国产中单选手...
《燕云十六声》战斗系统迎来全面... 都说国产武侠卷,没想到竟然已经卷到了这种程度!就拿12月27日即将上线的《燕云十六声》来说,不仅战斗...
IGN年度游戏大奖引争议,《黑... 在万众瞩目的2024年度游戏大奖颁奖典礼上,一款名为《暗喻幻想》的作品成功摘得了“年度最佳游戏”的桂...
燕云十六声12月27日公测倒计... 终终终于!《燕云十六声》终于正式进入12月27日公测倒计时啦!不少玩家也是忍不住前排表示自己急切的期...
诛仙世界:顶奢外观震撼登场,金... 在近期,一款名为《诛仙世界》的网络游戏凭借其震撼的游戏内元素,在各大社交平台掀起了一股热潮。尤其是其...
路易威登推出沉浸式游戏《Eni... 近日,法国奢侈品牌路易威登(Louis Vuitton)在游戏社群平台 Discord上推出了一款全...
IGN年度游戏大奖结果出炉 老... 2024-12-22 19:00:08 作者:姚立伟 2024年度游戏大奖落幕,《暗喻幻想》荣膺“...
打野榜单巨变,韩信T1,大司命... 王者荣耀作为国内热度最高的一款手游,受到很多玩家的喜欢,虽然版本在不断的变化,但是峡谷中依然是五大位...
原创 2... 以前战令皮肤曝光,都会在战令皮肤更新前的前两天进行,但是这一次提前太多。 虽然不知道为什么,但是我们...
原创 2... 大家好我是指尖,24年即将收官,准备好迎接2025年了吗? 对于王者而言,即将上线的S38赛季也对应...
神龙降世,万剑归宗,诛仙世界顶... 最近大家的社交平台应该都被诛仙世界这条百万坐骑刷屏了吧?这条金龙坐骑以其震撼的出场特效和华丽的外观著...
圣诞不打烊,游戏特惠来袭,你的... 随着节日氛围的日益浓厚,游戏爱好者们的热门话题也逐渐转向了即将到来的圣诞节。本周,杉果栏目再次与广大...
诛仙世界捏脸热潮:电竞大咖与玩... 随着《诛仙世界》公测的大门正式敞开,这款游戏迅速在游戏圈内掀起了一股狂潮,吸引了众多知名主播与电竞选...
原创 机... S38赛季的上线时间已经官宣了,将会在下周开启,同时新赛季的调整内容也会上线,在新赛季中,有多达十几...
系列主创:很久前曾警告《辐射》... 对于末世废土游戏来说,一个极大的特色就是孤独的氛围感,这一点在《辐射:新维加斯》中体现的非常好,也是...
《妹相随》新DLC上线 好评黑... Inusuku开发,一款黑白色调小清新恋爱冒险游戏《妹相随~黑白世界的缤纷冒险~》的新DLC上线,本...
星际战神Online新版本预告... 2024-12-22 17:41:09 作者:姚立伟 银河系中的光能族一直制造着恐怖的威胁,然而至...
原创 主... 标题:主人在打游戏,磨人猫咪竟做出这样的举动……选游戏还是选? 在这个快节奏的现代社会,人们常常被...
《弹球亿万富翁》销量突破10万... newobject开发,一款小众题材肉鸽元素加持的物理规则娱乐牌组新游《弹球亿万富翁》刚刚于12月1...