谷歌为Meta踩刹车?AI算力告急背后的行业暗战
最近科技圈有个瓜挺有意思,谷歌居然对Meta“限流”了。
由于算力紧张谷歌限制了Meta的Gemini使用量
没错,就是那个手握全球最大搜索引擎的谷歌,限制了Meta对Gemini大模型的使用量。理由其实很简单,也相当扎心:算力不够用了。
并不是谷歌小气,是GPU真的难顶
很多人第一反应可能是,谷歌难道是怕Meta做大?其实不然,这更多是一个物理问题。现在的AI发展速度太快了,尤其是像Gemini这种级别的多模态大模型,背后消耗的算力是天文数字。
当全球对AI的需求呈指数级爆发,哪怕是坐拥庞大数据中心资源的谷歌,手里的H100/B100等高端显卡资源也开始捉襟见肘。为了自家的搜索、广告和云业务能稳住,优先级调配必然向核心业务倾斜。这时候,像Meta这种既是合作伙伴又自带竞争属性的“外部大户”,被限额也就不难理解了。
科技巨头们的“相爱相杀”
这事儿也透露出一个新的行业风向:大家表面上是好同学,私底下都在暗自较劲。
Meta其实自己也在搞Llama系列大模型,而且开源生态搞得风生水起。他们找谷歌租用Gemini,本来就是为了补全自家在闭源高端模型上的短板,或者进行对比测试。但反观谷歌,肯定更希望Meta能依赖自家的TPU和Google Cloud,而不是仅仅把Gemini当成一个外包服务商。
谷歌这一限制,某种程度上也是在逼迫合作伙伴做出选择,或者至少在资源分配上给自家的亲儿子项目让路。这不仅仅是卖显卡租算力的生意,更是未来生态主导权的争夺。
算力紧缺会成为常态吗?
对于我们普通开发者或者吃瓜群众来说,这意味这啥?最直接的一点就是:免费的午餐可能越来越少,或者更难吃了。
以前那种动不动就免费开放API、低成本试错的好日子,随着算力成本的飙升,正在慢慢画上句号。不管是OpenAI、谷歌还是Anthropic,如何在商业变现和开发者生态之间找平衡,将是接下来的主旋律。
如果你正在跑项目,建议还是得多准备几套方案,“不要把鸡蛋放在同一个篮子里”这句话,在AI领域现在显得尤为灵验。毕竟谁也不知道下一个被“限流”的会不会是你正在用的那个模型。
评论已关闭