云服务算计变天?亚马逊 AWS 竟决定按 Token 结算 AI 模型账单
最近科技圈有个不太起眼但意味深长的消息,感觉很多人还没反应过来它背后的逻辑变化。事情是这样的:亚马逊 AWS 和那个跟 OpenAI 叫板的 Anthropic 签了个新协议,以后在 AWS 上跑 Anthropic 的模型,付费方式变了。
以前咱们用云服务跑模型,不管是训练还是推理,基本逻辑都是按你占用了多少算力(比如 GPU 小时数)来收费,这跟咱们租服务器是一个道理。但这次 AWS 和 Anthropic 玩了把大的——直接按 Token(词元)使用量来结算。
这意味着什么?
对于咱们普通开发者或者吃瓜群众来说,这好像只是个计费单位的区别,但对于亚马逊这种体量的巨头来说,这完全是另一本账。
1. 成本结构的彻底重构
消息里提到,亚马逊自己有不少业务其实是靠 Anthropic 的模型在驱动的,比如 Alexa 的购物助手、那个 Kiro 编程工具,还有 Quick 职场助手。这就很有意思了,以前不管模型输出快慢、好坏,只要 GPU 跑起来了,钱就得给云厂商(也就是 AWS 自己)。
现在改成按 Token 付费,意味着亚马逊作为“金主爸爸”,只有在模型真正输出了有效内容(生成了 Token)时才给 Anthropic 分成。这相当于把风险从“算力提供商”转移到了“模型提供商”身上。如果 Anthropic 的模型效率低、生成慢,那它的单位收入就会变低。这逼迫 Anthropic 必须持续优化推理效率,而不是单纯堆算力。
**2. 为什么是亚马逊“妥协”? **
传统的云服务按算力占用收费,而现在模式正在向按结果付费转变。
这其实反映了亚马逊目前的一点点“尴尬”。大家都知道 AWS 云服务猛,但在大模型这块,亚马逊自研的 Nova 系列模型目前竞争力确实有点乏力,跟 GPT-4、Claude 这种第一梯队比还差点意思。
为了不让自家云服务在 AI 时代掉队,AWS 不得不抱紧 Anthropic 的大腿。通过这种新的按 Token 分成模式,其实也是一种深度绑定:你模型好用,我给你流量,咱们按效果分钱。这比单纯的“我租卡给你”要紧密得多。
3. 另眼相看微软-OpenAI 模式
如果不拿这个去对比微软和 OpenAI 的关系,你就看不懂这步棋。当年微软也是疯狂砸钱给 OpenAI,换算力、换股权。但微软明显在两条腿走路:一边用 OpenAI 的模型武装 Copilot,一边自己疯狂搞小模型(如 Phi-3)和自研大模型。
亚马逊与 Anthropic 联手,通过深度绑定弥补自身大模型短板。
现在亚马逊也是同样的套路。虽然现在得依靠 Anthropic,但 AWS 的高层已经放话了,目标是明年推出能达到“前沿水平”的自研模型。这说明什么?说明现在的按 Token 付费,很可能只是一个过渡时期的妥协。
未来的风向标
这个新协议其实给整个行业提了个醒:AI 基础设施的定价权正在发生微妙的变化。
- 对于云厂商: 以后可能更多会从“卖算力”转向“卖智能成效”。单纯拼显卡堆叠可能不够了,你得能证明你的云环境能让模型跑出更高的 Token 效率。
- 对于模型厂商: 推理性能的优化不再是 Optional,而是 Mandatory。你的模型如果只是在训练时很强,但推理又慢又贵,在这种按 Token 结算的模式下,根本赚不到钱。
总结
亚马逊这波操作,既是无奈之举,也是精明之算。在面对自研模型短期跟不上的现实面前,用一种更激进的“按结果付费”模式来控制成本、绑定合作伙伴,同时给自己争取追赶的时间。
对于我们关注技术风向的人来说,可以预见的是,未来类似的“混合收费模式”或者“效果挂钩模式”会越来越多。毕竟,在 AI 掘金时代,谁也不想在沙子还没筛出金子的时候,就先把买筛子的钱给亏光了。
咱们且看,明年亚马逊能不能憋出自研的大招,或者Anthropic 会不会在这种模式下进化得更狠。

评论已关闭