谷歌限制Meta的Gemini使用量,算力荒成AI发展拦路虎
最近AI圈子里有个挺有意思的事儿,跟大家聊聊,也算是给关注行业风向的朋友们提个醒。
大家都知道Meta(也就是Facebook母公司)一直在大力搞AI开发吧?但你绝对想不到,像Meta这样的顶级科技公司,居然也会因为“缺卡”、“缺算力”被卡脖子。
一、 巨头也得“排队”买算力
科技巨头之间的算力博弈
根据《金融时报》的消息,谷歌在今年3月直接给Meta发了通知,说你们想要的Gemini大模型算力我给不了,太多了,供应不上。这直接导致Meta内部好几个AI项目进度卡壳,被迫延期。
这事儿特别讽刺。你想啊,Meta自己也是个科技巨头,按理说应该是不差钱的。但在现在的AI大模型时代,无论你是谁,想要训练好模型或者调用高端API,背后拼的都是实打实的基础设施。谷歌这次“限流”,不仅针对Meta,其他几家客户也被波及,只不过Meta因为需求量太大,受打击最严重。
Token成为稀缺资源
二、 员工被要求“省着点用”Token
为了应对这个局面,Meta甚至不得不要求员工在使用AI服务时“节约使用Token”。
对于不熟悉的朋友解释一下,Token(词元)就是AI大模型计费的原子单位。简单说,你问得越多、上下文越长,消耗的Token就越多,烧的钱和算力也越多。以前我们总觉得Token只是个计费概念,现在看来,它更像是稀缺的“能源”。连Meta内部都要精打细算,可见现在的资源有多紧张。
三、 算力焦虑是全行业的通病
别看各家科技公司财报上的云业务营收动辄几百亿美元(比如谷歌云一季度营收200亿美元),表面风光,背地里都在到处找GPU抢算力。谷歌的老大皮查伊自己也承认,算力供给瓶颈直接限制了云业务的增速,导致积压的订单量都快翻倍了。
这说明什么?说明现在的市场需求实在太爆炸了。各家都在砸几十亿美金买芯片、建数据中心,但这速度依然赶不上需求增长的速度。这就像是一场军备竞赛,谁的算力足,谁就能在AI时代占据高地;谁跟不上,谁就得掉队。
四、 对我们普通人的启示
这事儿虽然发生在大佬之间,但其实也跟我们有关系:
- API服务可能不稳定: 未来一段时间,如果你发现某些AI服务变慢了、变贵了或者甚至开始限额了,别太惊讶,这可能是常态。
- 中小团队要更注重效率: 大厂都被迫“限流”,小团队更要优化Prompt和模型调用逻辑,用更少的Token干更多的事。
- 关注基础设施领域: 除了大模型算法本身,解决算力瓶颈的技术(比如模型量化、异构计算)可能会是接下来的热点。
总而言之,AI这趟车虽然跑得快,但燃料确实有点供不上了。接下来这一年,估计类似的“算力荒”新闻还会层出不穷。
你是怎么看待这次谷歌限制Meta算力的事件的?欢迎在评论区聊聊你的看法。
评论已关闭