
GLM-5.2 实战体验:开源大模型终于让我用爽了
最近 AI 圈最大的新闻,除了 Claude Fable 5 被美国政府出口限制这事闹得沸沸扬扬,就是智谱在6月13号悄悄放出的 GLM-5.2 了。
说实话,一开始我没太当回事。从 5.1 到 5.2 就一个小版本号更新,能有多大变化?结果社区几天之内就炸了——Arena 智能体排行榜上,GLM-5.2 是唯一一个能和 OpenAI、Anthropic 最新模型掰手腕的开源模型。设计领域的评测甚至直接超过了 Claude Fable。这就有点意思了。
我花了三天在本地 4090 上跑了一遍,说说真实感受。
代码能力是真的强
拿我手头的项目试了试。之前用 Claude Code 搭的自动化脚本,同样跑在 GLM-5.2 上,写出来的代码几乎没差别。处理 Python 异步任务和 TypeScript 类型系统的时候,生成质量高得有点出乎意料。
更让我惊讶的是它对 Coding Harness 的支持。以前开源模型要么不支持工具调用,要么写一半就断掉了。但 GLM-5.2 在 Fireworks API 上跑 Claude Code 的 harness 几乎无缝——虽然中途碰上了图片输入导致会话崩掉的小问题,但整体体验已经很接近闭源模型了。
Vercel 的 CEO 发了条推:"GLM-5.2 的编码能力真的让我震惊了,这事改变了很多东西。"我试完之后觉得,这话不是吹的。
背后的技术其实没那么玄乎
扒了一下智谱公开的东西。GLM-5.2 用的是 SLIME 强化学习框架——智谱自己搞的,之前在 5.1 上已经在用了,但这次做了大幅优化。
还有个关键点:官方强烈建议在 Max 思考模式下用。我实测过,开 Max 和不开 Max,做复杂任务的质量差距肉眼可见。虽然慢了点,但值得。
权重是 MIT 协议开源的,已经挂到了 HuggingFace。国内开发者可以直接用,不用翻墙——这一点比 Claude 和 GPT 友好太多。
开源追上闭源,只用了半年
去年底 Claude Opus 4.5 发布的时候,国产开源模型跟它的差距还挺大的。当时业内普遍预测追赶周期在 9 到 12 个月。结果从 Opus 4.5(去年11月)到 GLM-5.2(今年6月),只花了 204 天——6.8 个月。
这不光是智谱一家的事。Kimi K2.7、GLM-5.1 这些国产模型也在快速迭代,整个开源生态正在以超出预期的速度逼近前沿。
有意思的是,智谱的创始人直接在推特上跟 Elon Musk 放话说:"开源版本的 Fable 级别能力,2027 年 Q1 之前就会来。"这口气放在两年前根本不敢想。
但也不是没毛病
中文长文本场景下偶尔会跑偏,写几千字的文档时中间逻辑会断。在 Cursor 这类 IDE 里的体验还不如 Claude 流畅,毕竟生态适配需要时间。完全发挥实力需要高配显卡,普通开发者跑 Max 模式还是挺吃力的。
但瑕不掩瑜。对大多数开发场景来说,GLM-5.2 已经是一个完全可用的日常编码伙伴了。毕竟是开源的,免费的,而且——你懂的——不会被突然封禁。
评论 (0)
暂无评论,来写第一条吧 ✍️