谷歌对Meta限流Gemini：AI算力紧张终于捂不住了

今天爆出来一个有意思的消息：谷歌对Meta的Gemini大模型使用量设限了。原因是Meta申请的算力规模太大，谷歌实在供不上。

这条消息来自英国《金融时报》，可信度还是有的。报道说Alphabet大概在今年3月就告诉Meta了——你们要的算力我们给不了。结果就是Meta内部好几个AI项目进度受阻，被迫延期。

更有意思的是，Meta已经要求员工节约使用AI Token了。这可是Meta啊，全球最大的科技公司之一，也要省着用Token。说白了就像是办公室的打印纸不够用了，老板说大家省着点打。听起来有点滑稽，但这就是AI行业现在的现实。

谷歌其他客户也被波及了，但Meta是最惨的。为什么呢？因为Meta对Gemini的需求太大了。你要知道Meta在社交、广告、推荐系统里全面押注AI，算力缺口一旦出现，影响面极广。

这背后其实暴露了一个更深的问题：AI算力的供给弹性，远远跟不上需求的爆发速度。

各大科技公司这半年投了多少钱买芯片、建数据中心？几百亿美元肯定是有的。但依然不够。谷歌CEO皮查伊自己也承认，算力瓶颈制约了云业务的增长，云部门的积压订单量环比近乎翻倍。翻译一下就是：客户排着队给钱，但我没东西卖。

回头看看国内的情况，大模型厂商一轮又一轮的降价，API调用成本已经跌到地板价了。但降价的背后是算力利用率在提升，不是算力总量突然变多了。字节、百度、阿里这些有自建算力的公司还能扛，但中小厂商的压力其实是越来越大的。

有人可能要问了：Meta不是自研了Llama吗？为什么还要用谷歌的Gemini？

这就牵扯到另一个问题了——自研模型也不能覆盖所有场景。Meta在某些特定任务上需要更强大的基座模型来做蒸馏、做对比实验，而Gemini在某些维度上确实比Llama强。再加上Meta的AI野心太大了，从社交推荐到AR眼镜到通用AI助手，每个方向都是吞算力的黑洞。

所以这次谷歌限流Meta，表面上是两个巨头之间的资源博弈，本质上是整个行业算力供给触顶的缩影。接下来可能会出现更多类似的事情——不是不想做AI，是真没算力做了。

不过换个角度看，这反而说明AI还在高速增长期。要是哪天河都不用抢了，那可能才是行业开始降温的信号。