AI开源生态正在经历一场「百花齐放」：这周模型圈太热闹了

这周AI圈发生了件挺值得聊的事。

A16Z的合伙人Guido在最新一期AI Artifacts里做了个总结：现在的大模型开源生态，已经不是「OpenAI vs Meta」的二元格局了。NVIDIA、Cohere、智谱（GLM）、Zyphra、Poolside……一堆公司都在往开源社区扔模型，而且质量越来越高。

说白了，AI开源这件事正在从一个「几个人在GitHub上鼓捣」的事，变成一场真正百花齐放的生态运动。

最让人惊喜的：GLM-5.2

智谱这次发布的GLM-5.2，被圈内很多人评价为「国产开源模型的天花板」。我试了一下，确实不是吹的。

跟上一代比，GLM-5.2在推理能力上有了明显提升，数学和代码能力也很能打。最让我意外的是它的中文理解能力——在处理一些需要文化背景、隐喻、双关语的任务时，比不少闭源模型都做得好。

而且智谱是真开源，不像某些公司搞个「开源版」然后阉割掉关键能力。GLM-5.2的权重直接放出来了，开发者可以自己下载、自己部署、自己微调。这件事的意义在于：你不用非得买OpenAI的API才能做高质量的AI应用了。

从下载数据来看，GLM-5.2发布后的下载量很快就追上甚至超过了LLaMA系列在同期表现。这说明社区是真的在用，不只是「收藏即支持」。

NVIDIA这次也不装了

NVIDIA这次掏出了Nemotron-3-Ultra-550B，550B参数的大模型，用了LatentMoE架构。这个架构很有意思——模型虽然很大，但每次推理只激活一部分参数，所以实际运行效率比同等规模的稠密模型高得多。

更关键的是，NVIDIA承诺用OpenMDW协议来发布权重。这个协议是专门针对模型权重设计的，比硬套MIT协议或者Apache协议要合理得多。大公司愿意正面响应社区对许可协议的关切，本身就是个积极的信号。

你可能会想：NVIDIA卖GPU的，开源模型对它有什么好处？Guido的分析说得很清楚——模型越火，对GPU的需求就越大。市场上多一个开源模型，可能就意味着多几个人来买NVIDIA的卡。

Cohere、Poolside也加入了

Cohere的Command A+，218B参数的MoE模型，这次直接给了Apache 2.0授权。以前的Command系列可是非商业授权的，这次放开意味着企业可以放心用它的权重来做商业产品。多模态、多语言、Agent能力一把抓，用一块B200就能跑4bit量化版本，对有算力但不太充裕的团队来说是个好选择。

Poolside也很有意思。这家公司专注代码生成，这次开源的Laguna-M.1直接说：「开源权重现在是我们的默认策略了。」并且承诺后续所有新模型都会继续开源。对于一个做商业化产品的公司来说，能做出这种承诺还是挺需要底气的。

为什么这波不一样

之前Meta开源LLaMA的时候，很多人觉得是「特例」——Meta家大业大，亏得起。但现在不同了，NVIDIA、Cohere、智谱、Poolside、Zyphra……各种不同类型的公司都在往开源社区投模型。

Guido的分析里有一个洞见我特别认同：现在的开源模型生态，已经不是「一个慈善家在撒钱」的模式，而是每个参与者都有自己的商业逻辑。

NVIDIA开源模型是为了让更多人用GPU；Cohere开源是为了抢占开发者心智；智谱开源是为了在全球舞台上建立技术影响力；Poolside开源是为了让更多企业信任它们的代码模型。各取所需，但最终都受益于整个开源生态的发展。

我的一点感受

AI行业的变化速度真的越来越快了。几个月前大家还在讨论「开源能不能追上闭源」，现在这个问题已经变成了「这么多开源模型我该用哪个」。

对于开发者来说，这是个好消息——选择多了，成本低了，门槛也低了。对于整个行业来说，也是个好消息——开源生态越繁荣，创新就越不会被少数几家公司垄断。

至于那些说「开源模型永远追不上闭源」的人，我觉得这个判断可能下得太早了。

⬇️ 你目前在用什么模型？开源还是闭源？评论区聊聊你的选择。

AI开源生态正在经历一场「百花齐放」：这周模型圈太热闹了