GLM-5.2 实战体验：开源大模型终于让我用爽了

GLM-5.2 封面

GLM-5.2 实战体验：开源大模型终于让我用爽了

最近 AI 圈最大的新闻，除了 Claude Fable 5 被美国政府出口限制这事闹得沸沸扬扬，就是智谱在6月13号悄悄放出的 GLM-5.2 了。

说实话，一开始我没太当回事。从 5.1 到 5.2 就一个小版本号更新，能有多大变化？结果社区几天之内就炸了——Arena 智能体排行榜上，GLM-5.2 是唯一一个能和 OpenAI、Anthropic 最新模型掰手腕的开源模型。设计领域的评测甚至直接超过了 Claude Fable。这就有点意思了。

我花了三天在本地 4090 上跑了一遍，说说真实感受。

代码能力是真的强

拿我手头的项目试了试。之前用 Claude Code 搭的自动化脚本，同样跑在 GLM-5.2 上，写出来的代码几乎没差别。处理 Python 异步任务和 TypeScript 类型系统的时候，生成质量高得有点出乎意料。

更让我惊讶的是它对 Coding Harness 的支持。以前开源模型要么不支持工具调用，要么写一半就断掉了。但 GLM-5.2 在 Fireworks API 上跑 Claude Code 的 harness 几乎无缝——虽然中途碰上了图片输入导致会话崩掉的小问题，但整体体验已经很接近闭源模型了。

Vercel 的 CEO 发了条推："GLM-5.2 的编码能力真的让我震惊了，这事改变了很多东西。"我试完之后觉得，这话不是吹的。

背后的技术其实没那么玄乎

扒了一下智谱公开的东西。GLM-5.2 用的是 SLIME 强化学习框架——智谱自己搞的，之前在 5.1 上已经在用了，但这次做了大幅优化。

还有个关键点：官方强烈建议在 Max 思考模式下用。我实测过，开 Max 和不开 Max，做复杂任务的质量差距肉眼可见。虽然慢了点，但值得。

权重是 MIT 协议开源的，已经挂到了 HuggingFace。国内开发者可以直接用，不用翻墙——这一点比 Claude 和 GPT 友好太多。

开源追上闭源，只用了半年

去年底 Claude Opus 4.5 发布的时候，国产开源模型跟它的差距还挺大的。当时业内普遍预测追赶周期在 9 到 12 个月。结果从 Opus 4.5（去年11月）到 GLM-5.2（今年6月），只花了 204 天——6.8 个月。

这不光是智谱一家的事。Kimi K2.7、GLM-5.1 这些国产模型也在快速迭代，整个开源生态正在以超出预期的速度逼近前沿。

有意思的是，智谱的创始人直接在推特上跟 Elon Musk 放话说："开源版本的 Fable 级别能力，2027 年 Q1 之前就会来。"这口气放在两年前根本不敢想。

但也不是没毛病

中文长文本场景下偶尔会跑偏，写几千字的文档时中间逻辑会断。在 Cursor 这类 IDE 里的体验还不如 Claude 流畅，毕竟生态适配需要时间。完全发挥实力需要高配显卡，普通开发者跑 Max 模式还是挺吃力的。

但瑕不掩瑜。对大多数开发场景来说，GLM-5.2 已经是一个完全可用的日常编码伙伴了。毕竟是开源的，免费的，而且——你懂的——不会被突然封禁。

GLM-5.2 实战体验：开源大模型终于让我用爽了