天天卖断货的 GLM-5.2，用起来到底值不值？_资讯

天天卖断货的 GLM-5.2，用起来到底值不值？

创始人

2026-06-18 04:35:13

说实话，一开始你和我说国产模型能比肩 Claude、GPT，我是拒绝的。

但是在世超蹲了三天，终于抢到了智谱的 Coding Plan 套餐，高强度蹬了两轮 token 之后。

发现这事好像真有点说法。。。

众所周知，前几天 Anthropic 又开始整活了，模型发的好好的，突然举起了 “ 安全 ” 的大旗，把上线刚几天的最强模型 Fable 5 给禁用了。

而就在这么个大家伙怨声载道的节骨眼，智谱出手了。

早上刚起来 Claude 发的禁令，下午智谱就用新模型的发布做为回应。

到今天更是一步到位，直接开放权重了，而且支持的还是最宽松的 MIT 协议，这意味着大家伙不但可以直接拿来自己用，还可以在它的基础上继续修改和商用。

而且同时还和国产的算力打了一波配合，直接和华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞这些国产算力平台完成了推理适配。

其实平时不太倒腾大模型的差友，可能对智谱这家略显低调的公司没啥概念。

但你要是去程序员扎堆的群里吼一嗓子，就知道上一代 GLM-5.1 的含金量有多高了，大家基本是一片好评，而差评则主要集中在两个方面。

一个是抢不到，这玩意比演唱会的门牌还难抢，每天早上十点钟准时刷新，能不能买到全凭手速。。。

第二个问题是模型的上下文长度只支持到了 256k，这就导致但如果你用它干点稍微复杂的活，上下文一被塞满，模型的能力就会有所下降。

而这次 GLM-5.2 的更新就把这个问题给很大的弥补了一波，痛定思痛，直接干到了百万上下文。

从几个最核心的长程任务跑分来看，GLM-5.2 这次的走位极其风骚，综合硬实力卡在了 Claude Opus 4.7 和 4.8 之间。

这还只是个开胃菜。虽然大伙现在对各种 AI 榜单多少有点脱敏，知道跑分只能当个参考，但尽管如此，GLM-5.2 这次的跑分看起来还是有些夸张了。

就这么说吧，在经典的全球用户盲评的大模型竞技场 Code Arena 上，GLM 5.2 直接拿下了能用上的模型里，全球第一的位置。。。

分数要比它还高的，就只有前几天被禁用了的 Claude Fable 5。

在 Artificial Analysis 这里，智谱的表现也仅次于 Claude 和 OpenAI 两家。

当然，跑分再高也只能做个参考，为了看看它是不是一个只会刷题的小镇做题家，世超把它直接拉出来测了一波。

先来个简单的题目开开胃，和前几天测试 Fable 时一样，我们让它先做了个旋转小球的游戏来尝尝咸淡。

编写一个 Python 程序，展示一个球在旋转的六边形内弹跳，六边形中只有五边是墙壁，其中一边是可通过的，小球碰到墙壁的时候自动分裂成两个，或者是穿过可通过的边界掉落到地图外面，球的运动轨迹应受到重力的影响，并且必须真实地反弹到旋转的墙壁上。在界面的左下角显示总共生成的小球数量，当所有小球都掉落到界面外面的时候，游戏结束，玩家可以重新开始游戏。

智谱做这题的思路倒是和 Fable 很像，没有和 GPT 一样做一堆花里胡哨的动效。

GPT 做的小球，加上了华丽的特效拖尾。

而是考虑到小球数量太多会影响性能的情况，限制了屏幕里 “ 当前小球 ” 的最大数量。

等前面的小球掉下去了之后，后面的小球还会继续生成。

GLM-5.2在 Claude Code 里做的效果

同时在没有任何提示的情况下，给这个小游戏用上了中文的 UI。

最近不是世界杯嘛，让它来做个点球模拟器也不在话下：

GLM-5.2 一次性直接把整个 3D 游戏给做了出来，玩起来倒是没啥问题，就是进球的判定有点宽松，世超有几轮看着球碰到了守门员，结果这球直接一个虚化遁入球门。

而 Claude Opus 4.8 做的就有点抽象了，虽然人做了个进球时的镜头跟随，但是它这程序直接做出 bug 来了，球一旦进了球门就会直接卡死。。。

至少在编程项目的逻辑这块，世超用下来并没有和 4.8 差太多。。。

当然，除了这些小游戏小 Demo，让它来做一些复杂的项目迁移也不是问题。

就比如最近世超在 Github 上刷到了一个蛮好玩的 AI 自动小说续写项目，你可以自己捏人设、定世界观，然后跟 AI 互动往下走剧情。

在电脑上盘了几天后，世超更是手痒了，感觉这种东西更适合放在手机上跑，抓住各种碎片化时间来聊两句，于是就琢磨着能不能把这玩意儿直接整个本地化移植，搬到手机上跑，给自己过一把作家瘾。

最开始准备拿 CodeX 来做个项目迁移，把原本的电脑项目给转到手机上。

结果没想到 Codex 上来就是一个否认三连，先是认为现在这个项目的本体是个前后端分别运行的项目，不适合搬到手机上跑。

然后又说认为这个项目如果重构的话会非常费劲，建议我只在手机上重构前端界面，然后再买个服务器，注册个域名来做后端业务。。。

？不是哥们，都 2026 年了，遇到点代码上的硬骨头，第一反应居然是让我加钱买服务器？ AI 还教起我做事了？

气得我反手就把一模一样的原话糊到了 GLM 的对话框里。

事实证明，在这事儿上，GLM 确实没 GPT 那么老油条。

人家根本没跟你扯什么退而求其次的替代方案，简单梳理了几句上下文，二话不说直接在后台拉起了三个 Agent，兵分三路直接扎进代码库里，实打实地去探究这玩意儿到底该怎么做底层的本地化迁移了。主打一个主观能动性拉满。

没多久就找到了 CodeX 没注意到的解决办法，帮我把这玩意在手机上跑起来扫平了障碍。

更让人蚌埠住的是，当我把 GLM5.2 的解决方案发给 CodeX 之后，它直接原地道歉，然后开始反思自己为啥没想到这招。。。

然后在经过了漫长的开发和迁移之后，很快 GLM-5.2 就把这个应用给搬到了 IOS 手机上。

开发中的过程还很有意思，众所周知，这次的 GLM 5.2 算是一个编程偏科的模型，并没有图像识别这种多模态能力。

按理说，这就意味着它没法像那些自带视觉的全能模型一样，遇到前端 UI 卡壳的时候，自己瞅一眼截图，看看排版问题到底出在哪里。

但是智谱的工程师想了个奇妙小连招来帮忙过度了一下。

真到了那种需要看图才能 Debug 的环节，智谱不会原地摆烂等人类来帮忙接管，而是会在后台悄咪咪地把图片外包出去。

直接发射给另一个专门负责视觉的识图模型。等这位视觉兄弟看完图、把里面的关键信息嚼碎了提取出来，再转手反哺给 GLM-5.2。

俩大模型直接在后台打了一波完美的辅助加输出配合，属于是把 GLM-5.2 目前还没有多模态能力的缺点给盘活了一部分。

但可惜的是也只盘活了一部分，和那些原生多模态的模型比起来，5.2 做出来的软件 UI 还是稍微差了一点意思。

比如这个小说自动续写项目，虽然最后世超把它成功给搬到了 IOS 上了。各种功能用起来也没啥 bug，逻辑都没出问题，但就是 UI 显的有些拥挤了，各种按钮和文本框挤得简直跟上下班早高峰时的秋石高架一样的。。。

这块想要做好，可能就需要我们能工智人来和 AI 好好的再配合一波了。

除此之外，这次体验下来，世超也能很明显的感觉到，或许是因为国产大模型厂商缺显卡的原因，GLM-5.2 运行起来的速度算不上快。

咱们最开头提到的那个旋转六边形的 Demo，之前世超不管是用 Claude 还是 GPT，基本上只要三分钟就能做完。

但到了智谱这里，做了整整十三分钟。

后面跑的几个测试 Demo，也是一不留神就会直接跑个三四十分钟。

很明显能感受到，这些国产的大模型厂商还是缺算力的。

可能也正是这个原因，才导致智谱的 Coding Plan 一直那么难抢了。

最后，世超对 GLM-5.2 的感觉还是挺复杂的。

好不容易买到了订阅之后，用了一天就快蹬完了周额度的 50%。

整体体验下来你要说它已经全面超越 Claude、GPT，那肯定有点吹过头了。

目前的 GLM-5.2 只能说在纯编码这块能和这些世界顶级的闭源模型来打个五五开。

但是要真的把一个项目做到完美，只靠编码这一个长板是不够的。

但是仔细看下来，这些事情很多又不是智谱的问题，甚至也不是智谱一家的问题。

罗马不是一天建成的，国产模型要补齐多模态生态和底层算力的短板也得慢慢熬。

前几天智谱宣布发布 GLM-5.2 的文章开头，提到了两句话：

前沿智能不应只属于少数人，也不应被少数规则随时收回

它应该开放、可用、可构建，并服务于每一位开发者。

世超觉得说的很对。

而且他们今天，也做到了。

撰文：早起

编辑：江江 & 面线

美编：素描

图片、资料来源：GLM 官网，X、https://github.com/alfredxw/nova

上一篇：智慧+绿色首艘平陆运河智能船舶示范船今天试航

下一篇：原创嘲讽Mac无游戏可玩，AMD怎么得了“红眼病”

天天卖断货的 GLM-5.2，用起来到底值不值？

相关内容

热门资讯