
刚消停两个月,AI圈又炸了
昨晚Anthropic放出了Claude Fable 5。这个事儿在AI圈炸得挺厉害,我简单说说怎么回事,以及为什么它跟之前那些"新模型发布"不是一个量级。
这个模型到底有多强?
先说数字。Fable 5在SWE-Bench Pro(一个测评AI写代码能力的基准)上干到了80.3%,而OpenAI的GPT-5.5是58.6%。差了二十多个点。在另一个叫FrontierCode Diamond的测试里,Mythos 5(Fable 5的完全版)得分30.9%,第二名的模型才13.4%。
按AI圈评测网站Artificial Analysis的话说,Fable 5在他们的"智能指数"上排到64.9分,比GPT-5.5高了差不多5分。Anthropic一口气把榜单前二都占了。
如果你对数字没概念,可以这么说:之前大家觉得GPT-5.5已经是天花板了,结果Anthropic直接把这个天花板给掀了。
但是,事情没那么简单
有意思的地方来了。Fable 5发布的时候,Anthropic搞了一套"安全措施",说如果检测到用户问的是网络安防、生物化学或者模型蒸馏相关的问题,会自动降级到Opus 4.8去回答。
听起来挺合理对吧?但问题在于,他们还加了一个"悄悄降级"的机制:如果模型判断你在做"前沿AI开发"相关的事,它不会告诉你,而是直接通过改prompt、调向量等方式让你觉得——这个模型怎么突然变笨了。而且用户完全不知情。
这个事在推特和Reddit上炸了锅。有人说这叫"AI不平等",有人说这是Anthropic在搞护城河、拔梯子。我没法判断他们的动机到底是安全还是商业竞争,但一个事实是:你用同一个API,付同样的钱,得到的服务质量可能因为"AI觉得你在做什么"而完全不同。这确实是不太对劲的。
背后的行业趋势
其实Fable 5的发布还透露了一个信息:AI大模型的竞争已经从"堆参数"转向了"抢生态"。你看Anthropic这次,Fable 5推出当天就接入了Cursor、Devin、Notion、GitHub Copilot、Cline等十几个平台。他们在抢的是开发者,是日常使用入口,是用生态把你绑定住。
OpenAI也没闲着。华尔街日报刚报道说,OpenAI正在考虑大幅降价跟Anthropic抢用户。价格战要开始了,这对咱们用AI的人其实是好事。
说人话总结
Fable 5确实很强,尤其写代码方面,已经明显甩开其他模型一截了。但这次的安全策略让人心里犯嘀咕——你用的是一个你搞不清楚它在背后干什么的"黑箱"。
如果你只是一个普通用户,写写代码、做做翻译、写个文案,那Fable 5很香。但如果你是做AI相关研究的,可能得小心点——你永远不知道你的prompt有没有被"静默处理"过。
对了,Anthropic还透露了一个信息:Fable 5只是"Mythos-class"模型的一个阉割版。那个完全版Mythos 5更吓人,但只对极少数合作方开放。这种分层开放的趋势一旦成形,以后"最强的AI"可能就真的跟你没关系了。
这事值得持续关注。
评论 (0)
暂无评论,来写第一条吧 ✍️