GLM-5.2 开源实测：用了三天，我决定换主力模型

用了三天GLM-5.2，我决定把主力模型换掉

说实话，最开始看到GLM-5.2发布的消息，我并没太当回事。毕竟这年头大模型发布跟下饺子似的，今天一个版本明天一个迭代，谁记得住啊。但架不住朋友圈和推特上铺天盖地的讨论——连Vercel的CEO都在说"被震惊到了"，我就想，得，试试吧。

这一试，就回不去了。

为什么说这是"开源模型的DeepSeek时刻"

先说说背景。GLM-5.2是智谱AI在6月16日正式开源的模型，MIT协议，权重随便下。圈内很多人在讨论它的时候，用的词是"转折点"——这是第一个在编程Agent场景下让人感觉"对了"的开源模型。

我在自己的项目里试了试。以前用其他开源模型写代码，经常干一会儿就卡住，逻辑跑飞了或者指令理解偏了，得反复调prompt。但GLM-5.2给我的感觉是——它真的懂你想干嘛。我在Claude Code的框架下切换到这个模型，让它帮忙重构一个Python模块，它不光理解了需求，还主动考虑了边界条件和异常处理。

Arena的Agent排行榜上，GLM-5.2是唯一一个能和OpenAI、Anthropic最新模型掰手腕的开源模型。Design Arena上甚至超过了被禁的Claude Fable。这数据不是我编的，大家都能查。

背后的几个细节值得聊

智谱这次用了他们自己搞的SLIME强化学习框架来训练。技术上我不太想堆术语，简单说就是——RL训练方式的进步，让模型的推理能力上了一个台阶。

有个有意思的对比：从去年11月Claude Opus 4.5发布，到今年6月GLM-5.2开源，中间隔了大概204天。也就是说，开源模型追上闭源前沿水平的时间差，已经缩短到7个月以内了。放在一年前，这几乎不敢想。

更关键的是，GLM-5.2在编程场景下的表现，让很多以前只能用Claude Code做的事，现在有了开源替代方案。我身边已经有朋友把团队的Agent框架从Anthropic换成了GLM-5.2跑在Fireworks上，每个月省了不少API费用。

跑在本地4090上的感觉

我试了在本地4090上跑GLM-5.2。说实话，体验比想象中好。响应速度够用，大部分编程场景不用开"全力思考"模式也能应对。偶尔遇到复杂逻辑，切到Max thinking模式，虽然慢一点，但结果质量明显提升。

当然，也不是没有槽点。有些场景下它跟某些工具的集成还不够丝滑——比如我在用Fireworks API的时候，如果错误地发送了图片输入，整个会话就崩了，得手动清上下文。但这种小问题随着生态完善应该能解决。

对整个行业意味着什么

我觉得GLM-5.2的出现，标志着一个阶段的结束。以前大家总说"开源模型差一点"，现在这个"差一点"正在被填平。成本优势加上可定制性，开源模型的春天可能真的来了。

顺便提一句，智谱的创始人最近跟Elon说了句狠话："开源模型达到Fable级别能力的时间不晚于2027年Q1。"敢这么放话，看来他们对后续路线图很有信心。

总之，如果你还在犹豫要不要试试开源模型，GLM-5.2可能是那个让你不再犹豫的答案。