天天卖断货的 GLM-5.2,用起来到底值不值?
创始人
2026-06-18 04:35:13

说实话,一开始你和我说国产模型能比肩 Claude、GPT,我是拒绝的。

但是在世超蹲了三天,终于抢到了智谱的 Coding Plan 套餐,高强度蹬了两轮 token 之后。

发现这事好像真有点说法。。。

众所周知,前几天 Anthropic 又开始整活了,模型发的好好的,突然举起了 “ 安全 ” 的大旗,把上线刚几天的最强模型 Fable 5 给禁用了。

而就在这么个大家伙怨声载道的节骨眼,智谱出手了。

早上刚起来 Claude 发的禁令,下午智谱就用新模型的发布做为回应。

到今天更是一步到位,直接开放权重了,而且支持的还是最宽松的 MIT 协议,这意味着大家伙不但可以直接拿来自己用,还可以在它的基础上继续修改和商用。

而且同时还和国产的算力打了一波配合,直接和华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞这些国产算力平台完成了推理适配。

其实平时不太倒腾大模型的差友,可能对智谱这家略显低调的公司没啥概念。

但你要是去程序员扎堆的群里吼一嗓子,就知道上一代 GLM-5.1 的含金量有多高了,大家基本是一片好评,而差评则主要集中在两个方面。

一个是抢不到,这玩意比演唱会的门牌还难抢,每天早上十点钟准时刷新,能不能买到全凭手速。。。

第二个问题是模型的上下文长度只支持到了 256k,这就导致但如果你用它干点稍微复杂的活,上下文一被塞满,模型的能力就会有所下降。

而这次 GLM-5.2 的更新就把这个问题给很大的弥补了一波,痛定思痛,直接干到了百万上下文。

从几个最核心的长程任务跑分来看,GLM-5.2 这次的走位极其风骚,综合硬实力卡在了 Claude Opus 4.7 和 4.8 之间。

这还只是个开胃菜。虽然大伙现在对各种 AI 榜单多少有点脱敏,知道跑分只能当个参考,但尽管如此,GLM-5.2 这次的跑分看起来还是有些夸张了。

就这么说吧,在经典的全球用户盲评的大模型竞技场 Code Arena 上,GLM 5.2 直接拿下了能用上的模型里,全球第一的位置。。。

分数要比它还高的,就只有前几天被禁用了的 Claude Fable 5。

在 Artificial Analysis 这里,智谱的表现也仅次于 Claude 和 OpenAI 两家。

当然,跑分再高也只能做个参考,为了看看它是不是一个只会刷题的小镇做题家,世超把它直接拉出来测了一波。

先来个简单的题目开开胃,和前几天测试 Fable 时一样,我们让它先做了个旋转小球的游戏来尝尝咸淡。

编写一个 Python 程序,展示一个球在旋转的六边形内弹跳,六边形中只有五边是墙壁,其中一边是可通过的,小球碰到墙壁的时候自动分裂成两个,或者是穿过可通过的边界掉落到地图外面,球的运动轨迹应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。 在界面的左下角显示总共生成的小球数量,当所有小球都掉落到界面外面的时候,游戏结束,玩家可以重新开始游戏。

智谱做这题的思路倒是和 Fable 很像,没有和 GPT 一样做一堆花里胡哨的动效。

GPT 做的小球,加上了华丽的特效拖尾。

而是考虑到小球数量太多会影响性能的情况,限制了屏幕里 “ 当前小球 ” 的最大数量。

等前面的小球掉下去了之后,后面的小球还会继续生成。

GLM-5.2在 Claude Code 里做的效果

同时在没有任何提示的情况下,给这个小游戏用上了中文的 UI。

最近不是世界杯嘛,让它来做个点球模拟器也不在话下:

GLM-5.2 一次性直接把整个 3D 游戏给做了出来,玩起来倒是没啥问题,就是进球的判定有点宽松,世超有几轮看着球碰到了守门员,结果这球直接一个虚化遁入球门。

而 Claude Opus 4.8 做的就有点抽象了,虽然人做了个进球时的镜头跟随,但是它这程序直接做出 bug 来了,球一旦进了球门就会直接卡死。。。

至少在编程项目的逻辑这块,世超用下来并没有和 4.8 差太多。。。

当然,除了这些小游戏小 Demo,让它来做一些复杂的项目迁移也不是问题。

就比如最近世超在 Github 上刷到了一个蛮好玩的 AI 自动小说续写项目,你可以自己捏人设、定世界观,然后跟 AI 互动往下走剧情。

在电脑上盘了几天后,世超更是手痒了,感觉这种东西更适合放在手机上跑,抓住各种碎片化时间来聊两句,于是就琢磨着能不能把这玩意儿直接整个本地化移植,搬到手机上跑,给自己过一把作家瘾。

最开始准备拿 CodeX 来做个项目迁移,把原本的电脑项目给转到手机上。

结果没想到 Codex 上来就是一个否认三连,先是认为现在这个项目的本体是个前后端分别运行的项目,不适合搬到手机上跑。

然后又说认为这个项目如果重构的话会非常费劲,建议我只在手机上重构前端界面,然后再买个服务器,注册个域名来做后端业务。。。

?不是哥们,都 2026 年了,遇到点代码上的硬骨头,第一反应居然是让我加钱买服务器? AI 还教起我做事了?

气得我反手就把一模一样的原话糊到了 GLM 的对话框里。

事实证明,在这事儿上,GLM 确实没 GPT 那么老油条。

人家根本没跟你扯什么退而求其次的替代方案,简单梳理了几句上下文,二话不说直接在后台拉起了三个 Agent,兵分三路直接扎进代码库里,实打实地去探究这玩意儿到底该怎么做底层的本地化迁移了。主打一个主观能动性拉满。

没多久就找到了 CodeX 没注意到的解决办法,帮我把这玩意在手机上跑起来扫平了障碍。

更让人蚌埠住的是,当我把 GLM5.2 的解决方案发给 CodeX 之后,它直接原地道歉,然后开始反思自己为啥没想到这招。。。

然后在经过了漫长的开发和迁移之后,很快 GLM-5.2 就把这个应用给搬到了 IOS 手机上。

开发中的过程还很有意思,众所周知,这次的 GLM 5.2 算是一个编程偏科的模型,并没有图像识别这种多模态能力。

按理说,这就意味着它没法像那些自带视觉的全能模型一样,遇到前端 UI 卡壳的时候,自己瞅一眼截图,看看排版问题到底出在哪里。

但是智谱的工程师想了个奇妙小连招来帮忙过度了一下。

真到了那种需要看图才能 Debug 的环节,智谱不会原地摆烂等人类来帮忙接管,而是会在后台悄咪咪地把图片外包出去。

直接发射给另一个专门负责视觉的识图模型。等这位视觉兄弟看完图、把里面的关键信息嚼碎了提取出来,再转手反哺给 GLM-5.2。

俩大模型直接在后台打了一波完美的辅助加输出配合,属于是把 GLM-5.2 目前还没有多模态能力的缺点给盘活了一部分。

但可惜的是也只盘活了一部分,和那些原生多模态的模型比起来,5.2 做出来的软件 UI 还是稍微差了一点意思。

比如这个小说自动续写项目,虽然最后世超把它成功给搬到了 IOS 上了。各种功能用起来也没啥 bug,逻辑都没出问题,但就是 UI 显的有些拥挤了,各种按钮和文本框挤得简直跟上下班早高峰时的秋石高架一样的。。。

这块想要做好,可能就需要我们能工智人来和 AI 好好的再配合一波了。

除此之外,这次体验下来,世超也能很明显的感觉到,或许是因为国产大模型厂商缺显卡的原因,GLM-5.2 运行起来的速度算不上快。

咱们最开头提到的那个旋转六边形的 Demo,之前世超不管是用 Claude 还是 GPT,基本上只要三分钟就能做完。

但到了智谱这里,做了整整十三分钟。

后面跑的几个测试 Demo,也是一不留神就会直接跑个三四十分钟。

很明显能感受到,这些国产的大模型厂商还是缺算力的。

可能也正是这个原因,才导致智谱的 Coding Plan 一直那么难抢了。

最后,世超对 GLM-5.2 的感觉还是挺复杂的。

好不容易买到了订阅之后,用了一天就快蹬完了周额度的 50%。

整体体验下来你要说它已经全面超越 Claude、GPT,那肯定有点吹过头了。

目前的 GLM-5.2 只能说在纯编码这块能和这些世界顶级的闭源模型来打个五五开。

但是要真的把一个项目做到完美,只靠编码这一个长板是不够的。

但是仔细看下来,这些事情很多又不是智谱的问题,甚至也不是智谱一家的问题。

罗马不是一天建成的,国产模型要补齐多模态生态和底层算力的短板也得慢慢熬。

前几天智谱宣布发布 GLM-5.2 的文章开头,提到了两句话:

前沿智能不应只属于少数人,也不应被少数规则随时收回

它应该开放、可用、可构建,并服务于每一位开发者。

世超觉得说的很对。

而且他们今天,也做到了。

撰文:早起

编辑:江江 & 面线

美编:素描

图片、资料来源:GLM 官网,X、https://github.com/alfredxw/nova

相关内容

热门资讯

原创 L... 各位LPL的观众和英雄联盟召唤师大家好,这里是天下游戏汇。 今年LOL赛事安排比较多,其中包含了两个...
今年7月中国将在上海举办202... 【大河财立方 记者 朱娟】6月17日,国务院新闻办公室举行新闻发布会,发布《构建更加公正合理的全球治...
“AI+电商”,如何点亮“61... 今年“618”购物节,AI嵌入多家电商平台,出现了不少新玩法、新模式,为消费注入全新活力。 在“AI...
无聊公司第二台掘进机就位,纳什... The Boring Company宣布,其第二台隧道掘进机“普鲁弗洛克MB2”(Prufrock ...
京东方第8.6代AMOLED生... 新华社成都6月17日电(记者李倩薇)17日,京东方第8.6代AMOLED生产线在成都量产,标志着其在...