马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
创始人
2024-08-15 04:21:15
0

图由网友使用Grok-2生成

出品|搜狐科技

作者|郑松毅

马斯克看来是不服谷歌抢风头,旗下公司xAI抓紧来凑热闹。

北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)。

xAI直接揭秘,前一阵子出现在Lmsys大模型竞技场上的神秘模型“sus-column-r”就是Grok-2。

在xAI给出的大模型排行榜中,Grok-2的评分优于GPT-4o-mini和Claude 3.5 Sonnet。

从xAI内部测试结果来看,相较于上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。

值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。

但细心网友不难发现,即便是Grok-2,在其他方面与前沿模型GPT-4o或Claude 3.5 Sonnet相比都稍显不足。这张图不得不说排版是费了心机(把GPT-4o和Claude 3.5 Sonnet安排得远远的)。

即便是这样的结果,马斯克还是对xAI的研发进度表示了肯定,“Grok推进速度如火箭。”

攻克经典难题

目前,Grok-2和Grok-2 mini在 X 平台处于测试阶段,X Premium和Premium+用户已经可以体验,模型将在本月晚些时候通过企业 API 的方式提供。

xAI表示,Grok-2的API将基于新的定制技术栈。

一方面是支持多区域推理部署,实现全球范围的低延迟访问。另一方面是增强安全功能。

模型刚发布不到半天,已有不少网友迫不及待玩了起来。

有人试了试,给前天马斯克和特朗普的公开对话配张图。

还有人试了试让特朗普和奥巴马一起在中国长城上吃烤肉。

不得不说,Grok-2生成图片的色彩饱和度还挺高,但图片细节处理仍有待改进(奥巴马的手为啥大一圈?)。

对于很火的“9.9和9.11比大小”的问题,难倒了GPT-4o,但没难住Grok-2(sus-column-r)。

意外收获是,经典的“strawberry”数“r”难题,也被Grok-2顺利攻克。

对xAI的偏爱

xAI 是由马斯克于 2023 年 7 月创立的一家公司,其目的是发展人工智能技术,构建安全的AI模型以帮助人类解决复杂的任务和挑战。

马斯克对xAI寄予厚望,甚至不惜牺牲特斯拉为xAI提供资源,以此帮助他实现在今年年底构建世界上最强大AI的目标。

xAI除了直接从特斯拉招募做软件研发的优秀员工,马斯克更是要求把预留给特斯拉的GPU转移到xAI。

“特斯拉收集的大量视觉数据可以作为xAI的训练资源。”马斯克说。

他在最近一次访谈中谈到,“追求深层次地理解事物是人工智能发展的目标,Grok也正在朝这个方向做出努力。

现在来看,Grok-2似乎只是小露锋芒,Grok-3才是马斯克憋的大招。

他透露,Grok-3正在孟菲斯数据中心同步训练推进中,大概会在3至4个月内完成训练,再进行微调和修错,希望能在12月前发布,Grok-3或将成为世界上最强大的AI大模型。

据悉,孟菲斯数据中心拥有全球最大的超算集群,10万块液冷H100助阵。从算力上来看,大约是OpenAI用于训练GPT4的25000块A100的20倍左右。

相关内容

热门资讯

“5G赋能展新质,融合制造铸未... 2024年9月10日-9月11日,第七届“绽放杯”5G应用征集大赛5G+先进制造专题赛决赛在福州成功...
揭牌!玉林广州开启合作新模式~ 近日,玉林—广州科技创新合作中心揭牌仪式在广州市黄埔区举行。这一举措是玉林市科技部门积极创新“研发在...
北青快评|注重亲子关系建设,助... “我叫吴可,今年12岁,已有7年网龄。视力5.1,不打游戏。我是一名抖音视频创作者……”抖音创作者@...
可用上千年!我国科学家成功实现 摆脱化学电池的寿命衰减困扰,性能不受温度等多种因素影响,理论上可使用上千年…… 据苏州大学23日消...
用算法卷向全世界,内地企业出海... 平台带来的方便与依赖性,结果是大家一起卷得天昏地暗——人工智能,或者说是升级版的 " 算法 ",在这...
新能源纯电动飞机八达岭机场首飞... 9月23日,八达岭长城脚下,新能源纯电动飞机——RX1E-A双座电动飞机延庆首飞仪式在八达岭机场举行...
2199元起!iQOO Z9 ... 9月24日,iQOO Z9系列迎来了“超大杯”——iQOO Z9 Turbo+。iQOO Z9 Tu...
原创 最... 最近很多人都奇怪,就是Zen5 CPU虽好,目前只有华硕一家推出产品,且价格不低,其他家都在干嘛呢?...
华为发布智慧屏V5 Max 1... 【环球网科技综合报道】9月24日下午,在华为秋季全场景新品发布会上,华为常务董事、终端BG董事长、智...
何氏眼科成功主办2024年国际... 转自:上海证券报·中国证券网 上证报中国证券网讯 近日,2024年国际基因组学大会眼科大会(The ...
为速度而生!ATFX服务器迁入... 2024-09-24 18:10:21 作者:姚立伟 以打造极致交易体验而闻名于业界的知名经纪商A...
百度推广开户多少钱一个月?效果... 对于很多想做百度推广的客户来说,很多人都非常关注一个问题,那就是百度推广一个月需要花多少钱、效果怎么...
贵阳学院大手拉小手科普校园行活... 9月15日-9月25日是第21个全国科普日,为积极响应全国科普日活动号召,提升全民科学素质,助力建设...
我国多项探月任务将按计划实施!... 快科技9月24日消息,国家航天局今天(9月24日)宣布,在完成嫦娥六号任务后,中国探月工程还将通过2...
英媒:使用在线约会软件相亲,很... 【环球时报综合报道】据英国《独立报》23日报道,最近的一项研究发现,使用Tinder、Bumble和...
科技强国建设扎实推进(奋进强国... 累计建成基站近400万个,5G移动电话用户达9.5亿户,建成全球规模最大、技术领先的5G网络,用户普...
华为WATCH GT 5上手:... 时隔一年,华为终于推出了第五代WATCH GT。 说起WATCH GT系列,作为华为旗下智能穿戴产品...
纯血鸿蒙来了!10.8公测 |... 声音 | 小白 今年6月华为举行了HDC开发者大会,介绍了HarmonyOS NEXT,由于不再兼容...
青春华章|科创报国青年说:青年... 青春华章|科创报国青年说:青年勤学早 创业刚刚好 - 新华网客户端 ...
华为WATCH GT 5系列首... 树立健康新标杆 除了装饰属性和消息提醒之外,智能手表记录运动信息、检测身体健康状态的功能同样重要。在...