一周之内五个大模型开源,AI圈这波太卷了
资讯动态 7 次阅读

一周之内五个大模型开源,AI圈这波太卷了

开源大模型扎堆发布

这周的AI圈有点热闹过头了。我数了数,光这一周就有五六个重要的开源模型发布,搞得我这种天天关注AI的人都快跟不上节奏了。

先说最扎眼的——GLM-5.2,智谱开源的。这个模型我跑了一周,说实话是真的让我改观了对国产开源模型的态度。代码能力、中文理解、指令跟随,各方面都挺能打。Apache 2.0许可,商用也没问题。

然后是poolside的Laguna-M.1。这家公司专注代码生成领域,这次也是Apache 2.0开源。commit说以后都会开源,做软件开发的朋友可以关注一下。

Zyphra的ZAYA1-74B也很有意思,MoE架构,74B参数里只有4B是激活的,所以推理速度特别快。复杂推理比不过GLM-5.2,但常规任务上性价比很高。

国内大模型也没闲着

月之暗面的Kimi K2.7 Code,主打Token效率优化,同样的任务花的Token更少。Step-3.7-Flash在数学推理上表现特别强。

还有个值得聊的事——亿生科技拿了数亿融资,给机器人装"记忆系统"。创始人是香港大学的马毅教授,思路跟现在主流不太一样,不搞VLA那一套,从"感知-预测-交互"的闭环去做。

光象科技也是清华孵化的,拿了数亿融资做工业机器人,已经在汽车产线上跑通了。这两家都不是最炫酷的人形路线,但都切到了实际能落地的场景。

字节的AI调整

对了,还看到个消息——字节的AI助手"豆包"下架了智能体功能。这背后其实是商业化和合规之间的博弈。智能体这东西,用户用起来方便,但出了事谁来担责?这波调整,本质上是在为合规扫清障碍。

结合腾讯最近也调整了元宝的功能,我估计下半年会有更多AI产品收敛功能边界,从"什么都做"转向"做好几件事"。

最后说两句

现在这个时间点,做AI应用开发的窗口期特别好。开源模型的能力上来了,API价格被打下来了,很多以前做不了的事现在都能做了。

关键是别贪大,从一个小场景入手,做深做透,机会还是很大的。

分享

评论 (0)

评论通过后显示

暂无评论,来写第一条吧 ✍️