GLM-5.2 开源实测:用了三天,我决定换主力模型
技术笔记 5 次阅读

GLM-5.2 开源实测:用了三天,我决定换主力模型

封面图

用了三天GLM-5.2,我决定把主力模型换掉

说实话,最开始看到GLM-5.2发布的消息,我并没太当回事。毕竟这年头大模型发布跟下饺子似的,今天一个版本明天一个迭代,谁记得住啊。但架不住朋友圈和推特上铺天盖地的讨论——连Vercel的CEO都在说"被震惊到了",我就想,得,试试吧。

这一试,就回不去了。

为什么说这是"开源模型的DeepSeek时刻"

先说说背景。GLM-5.2是智谱AI在6月16日正式开源的模型,MIT协议,权重随便下。圈内很多人在讨论它的时候,用的词是"转折点"——这是第一个在编程Agent场景下让人感觉"对了"的开源模型。

我在自己的项目里试了试。以前用其他开源模型写代码,经常干一会儿就卡住,逻辑跑飞了或者指令理解偏了,得反复调prompt。但GLM-5.2给我的感觉是——它真的懂你想干嘛。我在Claude Code的框架下切换到这个模型,让它帮忙重构一个Python模块,它不光理解了需求,还主动考虑了边界条件和异常处理。

Arena的Agent排行榜上,GLM-5.2是唯一一个能和OpenAI、Anthropic最新模型掰手腕的开源模型。Design Arena上甚至超过了被禁的Claude Fable。这数据不是我编的,大家都能查。

背后的几个细节值得聊

智谱这次用了他们自己搞的SLIME强化学习框架来训练。技术上我不太想堆术语,简单说就是——RL训练方式的进步,让模型的推理能力上了一个台阶。

有个有意思的对比:从去年11月Claude Opus 4.5发布,到今年6月GLM-5.2开源,中间隔了大概204天。也就是说,开源模型追上闭源前沿水平的时间差,已经缩短到7个月以内了。放在一年前,这几乎不敢想。

更关键的是,GLM-5.2在编程场景下的表现,让很多以前只能用Claude Code做的事,现在有了开源替代方案。我身边已经有朋友把团队的Agent框架从Anthropic换成了GLM-5.2跑在Fireworks上,每个月省了不少API费用。

跑在本地4090上的感觉

我试了在本地4090上跑GLM-5.2。说实话,体验比想象中好。响应速度够用,大部分编程场景不用开"全力思考"模式也能应对。偶尔遇到复杂逻辑,切到Max thinking模式,虽然慢一点,但结果质量明显提升。

当然,也不是没有槽点。有些场景下它跟某些工具的集成还不够丝滑——比如我在用Fireworks API的时候,如果错误地发送了图片输入,整个会话就崩了,得手动清上下文。但这种小问题随着生态完善应该能解决。

对整个行业意味着什么

我觉得GLM-5.2的出现,标志着一个阶段的结束。以前大家总说"开源模型差一点",现在这个"差一点"正在被填平。成本优势加上可定制性,开源模型的春天可能真的来了。

顺便提一句,智谱的创始人最近跟Elon说了句狠话:"开源模型达到Fable级别能力的时间不晚于2027年Q1。"敢这么放话,看来他们对后续路线图很有信心。

总之,如果你还在犹豫要不要试试开源模型,GLM-5.2可能是那个让你不再犹豫的答案。

分享

评论 (0)

评论通过后显示

暂无评论,来写第一条吧 ✍️