GLM-5.2开源模型实测：国产大模型终于追上Claude了？

GLM-5.2开源模型实测：国产大模型终于追上Claude了？

就在Anthropic的Claude Fable 5被美国政府限制出口、整个AI圈子还在震惊中的时候，智谱AI在6月13号悄悄放出了GLM-5.2。选在周末发布，这操作本身就挺有意思的——通常只有大新闻才会选这种时间点。

我花了一周时间深度用了一下GLM-5.2，说说真实感受。

先说结论：这可能是国产开源大模型第一次真正具备了跟Claude叫板的实力。

GLM-5.2最让人惊艳的地方不是在刷榜的benchmark上，而是在实际使用中的体验。我在Claude Code上配置了Fireworks的API来跑GLM-5.2，让它做一些日常的编程任务——写脚本、修bug、重构代码。结果出乎意料地顺手，尤其是在代码理解和生成质量上，跟Claude Opus 4.5的差距已经非常小了。

社区里跟我有类似感受的人不少。Arena的agent排行榜上，GLM-5.2是唯一一个能跟OpenAI和Anthropic最新模型掰手腕的开源模型。Vercel的CEO发推说"真被惊艳到了，GLM-5.2的编程能力几乎让我震惊"，Kimi K2之后GLM-5.2又把这个天花板往上推了一大截。

这背后有几个关键的技术点值得说一下。

首先是训练方法。GLM-5.2用了Z.ai自研的RL框架SLIME来做强化学习，而不是简单堆数据。这意味着模型不是死记硬背，而是在反复试错中学会了更好的推理路径。用Max模式跑的时候，思考链路的清晰度明显比GLM-5.1高了一个档次。

其次，GLM-5.2是MIT开源协议。这意味着你可以下载到本地随便跑，甚至商用都没问题。在Claude被美国政府限制的大背景下，这个开放性的价值被放大了很多倍。很多欧洲的企业本来还在犹豫要不要上国产大模型，现在直接被推了一把。

不过，GLM-5.2也不是没有缺点。在一些需要大量上下文的长任务中，它偶尔会出现"走神"的情况——推理到一半忘了前面的结论。另外在多模态能力上，跟GPT-4o和Gemini还有差距，毕竟GLM主要还是侧重大语言模型能力。

但从趋势上看，GLM-5.2的意义可能比我们想象的要大得多。它证明了国产大模型在少资源、少算力的情况下，通过算法和工程创新，也能追赶上闭源巨头的水平。从DeepSeek R1到Kimi K2再到GLM-5.2，这个追赶速度比大多数人预想的要快。

对开发者来说，不管你现在用哪个模型，GLM-5.2都值得花半天时间试一下。毕竟一个能用Claude Code一样顺手的、完全开源的、MIT协议的替代品，在这个时代是一件很奢侈的事。

GLM-5.2开源模型实测：国产大模型终于追上Claude了？

GLM-5.2开源模型实测：国产大模型终于追上Claude了？

评论 (0)