芯片不够用?谷歌给 Meta 限制了 Gemini 算力,AI 厂家遭遇“电荒”式难题
最近科技圈的一条新闻挺有意思,大家平时总觉得这些互联网大厂是“要风得风,要雨得雨”,结果在 AI 这块,也有被卡脖子的时候。
事情是这样的:据英国《金融时报》报道,Meta 想要向谷歌租借大量的算力来跑他们的 AI 项目,结果谷歌直接回复——“货不够,卖不了那么多”。这导致谷歌不得不对 Meta 调用其 Gemini 大模型实施了限制,甚至从今年 3 月份开始,Meta 的好多内部 AI 项目因为没算力可用,只能被迫延期。
需求过大供给跟不上,消息称谷歌限制了 Meta 的 Gemini 使用量
算力成了硬通货,连大厂都得省着用
咱们平时用 AI,可能觉得就是个聊天框,输进去字,吐出来字。但对于 Meta 这种体量的公司来说,那是“吞金兽”级别的消耗。报道里提到一个很有意思的细节:受此影响,Meta 已经要求内部员工开始“节约使用 AI 词元”。
**“词元”**是啥?你可以简单理解为 AI 消耗的“流量”或者“电费”。你问的问题越长,它回答得越长,消耗的 Token 就越多。现在连 Meta 这种拥有海量数据的大厂,都要勒紧裤腰带让员工省着用 Token,可见现在的算力紧缺到了什么地步。
投入几百亿,还是填不满这个坑
你可能会问,谷歌不是有钱吗?Meta 不是也刚买了大量的 H100 显卡吗?怎么还会缺算力?
这就是 AI 发展的现状:需求增长的速度,远超基础设施建设的速度。
虽然这几家巨头都在疯狂砸钱,几十亿几十亿地买芯片、建数据中心,但市场对 AI 的需求简直就是个无底洞。谷歌的一季度财报显示,云营收虽然达到了 200 亿美元,看似风光,但 CEO 桑达尔·皮查伊自己都承认,算力供给瓶颈制约了云业务实现更高的增速。甚至因为供不上货,积压的订单量直接环比翻了近一倍。
这一波波及谁?
谷歌限制 Meta,并不是只针对 Meta 这一家的“杀熟”。报道提到,谷歌的其他好几家客户也受到了波及,只不过因为 Meta 的胃口太大,需求规模最夸张,所以受冲击最严重,成了那个被点名的典型。
这事儿给我们的启示
从普通开发者和博主的角度来看,这事儿传递了几个挺明显的信号:
- 云服务涨价或者限额可能会常态化:如果连大客户都限制,那未来针对中小开发者的 API 限制或价格调整可能随时会来。大家在做产品规划时,一定要把算力成本和潜在的风险算进去。
- 模型不仅要“大”,还得“省”:在这种算力紧缺的背景下,那种既聪明又省参数的小模型(SLM)或者量化模型,可能比单纯追求参数规模的巨无霸更有实际落地价值。
- 自建算力壁垒:Meta 之所以这么被动,也是因为依赖外部调用。现在各大厂都在拼命搞自己的 TPU、GPU 集群,根本原因就是不想把自己的命脉交到别人手里。
总而言之,AI 这场仗,现在已经不仅仅是拼算法创意了,更是拼谁手里有更多的显卡,谁有更稳定的电力和数据中心。对于我们普通人来说,这可能意味着以后免费或者好用的 AI 服务,门槛会越来越高,且用且珍惜吧。
评论已关闭