开源大模型扎堆发布
这周的AI圈有点热闹过头了。我数了数,光这一周就有五六个重要的开源模型发布,搞得我这种天天关注AI的人都快跟不上节奏了。
先说最扎眼的——GLM-5.2,智谱开源的。这个模型我跑了一周,说实话是真的让我改观了对国产开源模型的态度。代码能力、中文理解、指令跟随,各方面都挺能打。Apache 2.0许可,商用也没问题。
然后是poolside的Laguna-M.1。这家公司专注代码生成领域,这次也是Apache 2.0开源。commit说以后都会开源,做软件开发的朋友可以关注一下。
Zyphra的ZAYA1-74B也很有意思,MoE架构,74B参数里只有4B是激活的,所以推理速度特别快。复杂推理比不过GLM-5.2,但常规任务上性价比很高。
国内大模型也没闲着
月之暗面的Kimi K2.7 Code,主打Token效率优化,同样的任务花的Token更少。Step-3.7-Flash在数学推理上表现特别强。
还有个值得聊的事——亿生科技拿了数亿融资,给机器人装"记忆系统"。创始人是香港大学的马毅教授,思路跟现在主流不太一样,不搞VLA那一套,从"感知-预测-交互"的闭环去做。
光象科技也是清华孵化的,拿了数亿融资做工业机器人,已经在汽车产线上跑通了。这两家都不是最炫酷的人形路线,但都切到了实际能落地的场景。
字节的AI调整
对了,还看到个消息——字节的AI助手"豆包"下架了智能体功能。这背后其实是商业化和合规之间的博弈。智能体这东西,用户用起来方便,但出了事谁来担责?这波调整,本质上是在为合规扫清障碍。
结合腾讯最近也调整了元宝的功能,我估计下半年会有更多AI产品收敛功能边界,从"什么都做"转向"做好几件事"。
最后说两句
现在这个时间点,做AI应用开发的窗口期特别好。开源模型的能力上来了,API价格被打下来了,很多以前做不了的事现在都能做了。
关键是别贪大,从一个小场景入手,做深做透,机会还是很大的。

评论 (0)
暂无评论,来写第一条吧 ✍️