GLM-5.2开源模型实测:国产大模型终于追上Claude了?
就在Anthropic的Claude Fable 5被美国政府限制出口、整个AI圈子还在震惊中的时候,智谱AI在6月13号悄悄放出了GLM-5.2。选在周末发布,这操作本身就挺有意思的——通常只有大新闻才会选这种时间点。
我花了一周时间深度用了一下GLM-5.2,说说真实感受。
先说结论:这可能是国产开源大模型第一次真正具备了跟Claude叫板的实力。
GLM-5.2最让人惊艳的地方不是在刷榜的benchmark上,而是在实际使用中的体验。我在Claude Code上配置了Fireworks的API来跑GLM-5.2,让它做一些日常的编程任务——写脚本、修bug、重构代码。结果出乎意料地顺手,尤其是在代码理解和生成质量上,跟Claude Opus 4.5的差距已经非常小了。
社区里跟我有类似感受的人不少。Arena的agent排行榜上,GLM-5.2是唯一一个能跟OpenAI和Anthropic最新模型掰手腕的开源模型。Vercel的CEO发推说"真被惊艳到了,GLM-5.2的编程能力几乎让我震惊",Kimi K2之后GLM-5.2又把这个天花板往上推了一大截。
这背后有几个关键的技术点值得说一下。
首先是训练方法。GLM-5.2用了Z.ai自研的RL框架SLIME来做强化学习,而不是简单堆数据。这意味着模型不是死记硬背,而是在反复试错中学会了更好的推理路径。用Max模式跑的时候,思考链路的清晰度明显比GLM-5.1高了一个档次。
其次,GLM-5.2是MIT开源协议。这意味着你可以下载到本地随便跑,甚至商用都没问题。在Claude被美国政府限制的大背景下,这个开放性的价值被放大了很多倍。很多欧洲的企业本来还在犹豫要不要上国产大模型,现在直接被推了一把。
不过,GLM-5.2也不是没有缺点。在一些需要大量上下文的长任务中,它偶尔会出现"走神"的情况——推理到一半忘了前面的结论。另外在多模态能力上,跟GPT-4o和Gemini还有差距,毕竟GLM主要还是侧重大语言模型能力。
但从趋势上看,GLM-5.2的意义可能比我们想象的要大得多。它证明了国产大模型在少资源、少算力的情况下,通过算法和工程创新,也能追赶上闭源巨头的水平。从DeepSeek R1到Kimi K2再到GLM-5.2,这个追赶速度比大多数人预想的要快。
对开发者来说,不管你现在用哪个模型,GLM-5.2都值得花半天时间试一下。毕竟一个能用Claude Code一样顺手的、完全开源的、MIT协议的替代品,在这个时代是一件很奢侈的事。
评论 (0)
暂无评论,来写第一条吧 ✍️