AI开源生态正在经历一场「百花齐放」:这周模型圈太热闹了
这周AI圈发生了件挺值得聊的事。
A16Z的合伙人Guido在最新一期AI Artifacts里做了个总结:现在的大模型开源生态,已经不是「OpenAI vs Meta」的二元格局了。NVIDIA、Cohere、智谱(GLM)、Zyphra、Poolside……一堆公司都在往开源社区扔模型,而且质量越来越高。
说白了,AI开源这件事正在从一个「几个人在GitHub上鼓捣」的事,变成一场真正百花齐放的生态运动。
最让人惊喜的:GLM-5.2
智谱这次发布的GLM-5.2,被圈内很多人评价为「国产开源模型的天花板」。我试了一下,确实不是吹的。
跟上一代比,GLM-5.2在推理能力上有了明显提升,数学和代码能力也很能打。最让我意外的是它的中文理解能力——在处理一些需要文化背景、隐喻、双关语的任务时,比不少闭源模型都做得好。
而且智谱是真开源,不像某些公司搞个「开源版」然后阉割掉关键能力。GLM-5.2的权重直接放出来了,开发者可以自己下载、自己部署、自己微调。这件事的意义在于:你不用非得买OpenAI的API才能做高质量的AI应用了。
从下载数据来看,GLM-5.2发布后的下载量很快就追上甚至超过了LLaMA系列在同期表现。这说明社区是真的在用,不只是「收藏即支持」。
NVIDIA这次也不装了
NVIDIA这次掏出了Nemotron-3-Ultra-550B,550B参数的大模型,用了LatentMoE架构。这个架构很有意思——模型虽然很大,但每次推理只激活一部分参数,所以实际运行效率比同等规模的稠密模型高得多。
更关键的是,NVIDIA承诺用OpenMDW协议来发布权重。这个协议是专门针对模型权重设计的,比硬套MIT协议或者Apache协议要合理得多。大公司愿意正面响应社区对许可协议的关切,本身就是个积极的信号。
你可能会想:NVIDIA卖GPU的,开源模型对它有什么好处?Guido的分析说得很清楚——模型越火,对GPU的需求就越大。市场上多一个开源模型,可能就意味着多几个人来买NVIDIA的卡。
Cohere、Poolside也加入了
Cohere的Command A+,218B参数的MoE模型,这次直接给了Apache 2.0授权。以前的Command系列可是非商业授权的,这次放开意味着企业可以放心用它的权重来做商业产品。多模态、多语言、Agent能力一把抓,用一块B200就能跑4bit量化版本,对有算力但不太充裕的团队来说是个好选择。
Poolside也很有意思。这家公司专注代码生成,这次开源的Laguna-M.1直接说:「开源权重现在是我们的默认策略了。」并且承诺后续所有新模型都会继续开源。对于一个做商业化产品的公司来说,能做出这种承诺还是挺需要底气的。
为什么这波不一样
之前Meta开源LLaMA的时候,很多人觉得是「特例」——Meta家大业大,亏得起。但现在不同了,NVIDIA、Cohere、智谱、Poolside、Zyphra……各种不同类型的公司都在往开源社区投模型。
Guido的分析里有一个洞见我特别认同:现在的开源模型生态,已经不是「一个慈善家在撒钱」的模式,而是每个参与者都有自己的商业逻辑。
NVIDIA开源模型是为了让更多人用GPU;Cohere开源是为了抢占开发者心智;智谱开源是为了在全球舞台上建立技术影响力;Poolside开源是为了让更多企业信任它们的代码模型。各取所需,但最终都受益于整个开源生态的发展。
我的一点感受
AI行业的变化速度真的越来越快了。几个月前大家还在讨论「开源能不能追上闭源」,现在这个问题已经变成了「这么多开源模型我该用哪个」。
对于开发者来说,这是个好消息——选择多了,成本低了,门槛也低了。对于整个行业来说,也是个好消息——开源生态越繁荣,创新就越不会被少数几家公司垄断。
至于那些说「开源模型永远追不上闭源」的人,我觉得这个判断可能下得太早了。
⬇️ 你目前在用什么模型?开源还是闭源?评论区聊聊你的选择。
评论 (0)
暂无评论,来写第一条吧 ✍️