今天爆出来一个有意思的消息:谷歌对Meta的Gemini大模型使用量设限了。原因是Meta申请的算力规模太大,谷歌实在供不上。
这条消息来自英国《金融时报》,可信度还是有的。报道说Alphabet大概在今年3月就告诉Meta了——你们要的算力我们给不了。结果就是Meta内部好几个AI项目进度受阻,被迫延期。
更有意思的是,Meta已经要求员工节约使用AI Token了。这可是Meta啊,全球最大的科技公司之一,也要省着用Token。说白了就像是办公室的打印纸不够用了,老板说大家省着点打。听起来有点滑稽,但这就是AI行业现在的现实。
谷歌其他客户也被波及了,但Meta是最惨的。为什么呢?因为Meta对Gemini的需求太大了。你要知道Meta在社交、广告、推荐系统里全面押注AI,算力缺口一旦出现,影响面极广。
这背后其实暴露了一个更深的问题:AI算力的供给弹性,远远跟不上需求的爆发速度。
各大科技公司这半年投了多少钱买芯片、建数据中心?几百亿美元肯定是有的。但依然不够。谷歌CEO皮查伊自己也承认,算力瓶颈制约了云业务的增长,云部门的积压订单量环比近乎翻倍。翻译一下就是:客户排着队给钱,但我没东西卖。
回头看看国内的情况,大模型厂商一轮又一轮的降价,API调用成本已经跌到地板价了。但降价的背后是算力利用率在提升,不是算力总量突然变多了。字节、百度、阿里这些有自建算力的公司还能扛,但中小厂商的压力其实是越来越大的。
有人可能要问了:Meta不是自研了Llama吗?为什么还要用谷歌的Gemini?
这就牵扯到另一个问题了——自研模型也不能覆盖所有场景。Meta在某些特定任务上需要更强大的基座模型来做蒸馏、做对比实验,而Gemini在某些维度上确实比Llama强。再加上Meta的AI野心太大了,从社交推荐到AR眼镜到通用AI助手,每个方向都是吞算力的黑洞。
所以这次谷歌限流Meta,表面上是两个巨头之间的资源博弈,本质上是整个行业算力供给触顶的缩影。接下来可能会出现更多类似的事情——不是不想做AI,是真没算力做了。
不过换个角度看,这反而说明AI还在高速增长期。要是哪天河都不用抢了,那可能才是行业开始降温的信号。
评论 (0)
暂无评论,来写第一条吧 ✍️