GLM-5.2 在本地跑了一周后,我把 Claude 的订阅停了
技术笔记 0 次阅读

GLM-5.2 在本地跑了一周后,我把 Claude 的订阅停了

GLM-5.2 在本地跑了一周后

GLM-5.2 在本地跑了一周后,我把 Claude 的订阅停了

说实话,一开始我没太把 GLM-5.2 当回事。智谱的模型我一直用着,GLM-5.1 不错,但离 Claude 还有距离。这次版本号才涨了个小数点,能有什么大变化?

结果我错了。

事情的起因是上周在群里看到好几个同行都在聊这个模型,说编码能力突飞猛进。我心想,试试也不亏。于是花了一个下午,在本地 4090 上搭好了环境,把 GLM-5.2 的权重拉下来跑了跑。

第一印象是什么?快。出乎意料的快。同样的代码生成任务,Claude Opus 4.5 大概要 10 秒开始输出,GLM-5.2 几乎秒出。而且质量嘛...我做了个盲测:让同事分别用两个模型写一个简单的 Python 爬虫,然后混在一起让我判断哪个是哪个。五轮下来,我猜错了三次。

真正让我惊讶的是编码智能体场景

GLM-5.2 真正让我改观的是它在智能体场景下的表现。我把它接进了 Claude Code 的 harness 里(用 Fireworks 的 API),给它布置了一个重构任务——把项目里一个 2000 行的老模块拆成几个小文件。

之前我用 GLM-5.1 做过同样的事,拆到一半就迷失了,生成的代码跑不起来。但 GLM-5.2 全程没掉链子,自己规划了拆分的步骤,还把每个文件的依赖关系理得清清楚楚。整个重构花了一下午,生成的代码直接跑过了单元测试。

就是那一刻,我认真考虑了一下要不要继续续费 Claude Pro 的订阅。

当然不能说它完美无缺。有些地方还是能感觉到差距:复杂的前端交互生成上 Claude 更稳,特别是涉及到多组件联动的时候。而且 GLM-5.2 的 Max thinking 模式下虽然能力强了很多,但推理时间明显拉长,一句话等十几秒的感觉并不好受。

但你要考虑到——这玩意儿是开源的。MIT 协议,随便用,不用算 Token 钱。对于一个独立开发者来说,这意味着什么?意味着你可以在自己的机器上跑,不限量调用。

开源模型终于跨过了一道门槛

在我看来,GLM-5.2 标志着开源模型跨过了一道关键门槛。过去两年,开源模型和闭源模型之间一直存在一条隐形的鸿沟:闭源模型「能干活」,开源模型「差不多但差一点」。那一点差距,刚好卡在让人愿意掏钱的临界点上。

GLM-5.2 把这个差距缩小到了几乎可以忽略的程度。LMArena 的智能体排行榜上,它是唯一一个能和 OpenAI、Anthropic 最新模型掰手腕的开源模型。Vercel 的 CEO 公开说「被 GLM-5.2 的编程能力震惊到了」——这可不是什么客气话。

而且这次发布的时间点很有意思。刚好卡在 Anthropic 被美国政府限制出口 Claude Mythos 系列模型的节骨眼上。智谱周六悄无声息地放出了权重,三天后国内外开发者圈就炸了。从 HuggingFace 下载量到 GitHub 讨论,热度一路走高。

我现在的工作流是这样的:日常编码和复杂任务还是用 Claude,但批量处理、实验性项目、以及一些不那么敏感但量大的活儿,全丢给了本地跑的 GLM-5.2。一个月算下来,API 费用至少省了一半。

当然,这不是说 Claude 不行了。人家毕竟还有最前沿的 Fable 5 压阵。但对于我们这些天天跟代码打交道的开发者来说,多一个能打的开源选择,总归是好事。

我已经把主力模型换成了 GLM-5.2,至少在这台 4090 上,它已经成了我写代码时的默认搭档。如果你也在纠结要不要试,我的建议是:别犹豫,拉下来跑一天试试。反正不要钱。

分享

评论 (0)

评论通过后显示

暂无评论,来写第一条吧 ✍️