云服务算计变天？亚马逊 AWS 竟决定按 Token 结算 AI 模型账单

最近科技圈有个不太起眼但意味深长的消息，感觉很多人还没反应过来它背后的逻辑变化。事情是这样的：亚马逊 AWS 和那个跟 OpenAI 叫板的 Anthropic 签了个新协议，以后在 AWS 上跑 Anthropic 的模型，付费方式变了。

以前咱们用云服务跑模型，不管是训练还是推理，基本逻辑都是按你占用了多少算力（比如 GPU 小时数）来收费，这跟咱们租服务器是一个道理。但这次 AWS 和 Anthropic 玩了把大的——直接按 Token（词元）使用量来结算。

这意味着什么？

对于咱们普通开发者或者吃瓜群众来说，这好像只是个计费单位的区别，但对于亚马逊这种体量的巨头来说，这完全是另一本账。

1. 成本结构的彻底重构

消息里提到，亚马逊自己有不少业务其实是靠 Anthropic 的模型在驱动的，比如 Alexa 的购物助手、那个 Kiro 编程工具，还有 Quick 职场助手。这就很有意思了，以前不管模型输出快慢、好坏，只要 GPU 跑起来了，钱就得给云厂商（也就是 AWS 自己）。

现在改成按 Token 付费，意味着亚马逊作为“金主爸爸”，只有在模型真正输出了有效内容（生成了 Token）时才给 Anthropic 分成。这相当于把风险从“算力提供商”转移到了“模型提供商”身上。如果 Anthropic 的模型效率低、生成慢，那它的单位收入就会变低。这逼迫 Anthropic 必须持续优化推理效率，而不是单纯堆算力。

**2. 为什么是亚马逊“妥协”？ **

数据中心 GPU 算力资源示意图

传统的云服务按算力占用收费，而现在模式正在向按结果付费转变。

这其实反映了亚马逊目前的一点点“尴尬”。大家都知道 AWS 云服务猛，但在大模型这块，亚马逊自研的 Nova 系列模型目前竞争力确实有点乏力，跟 GPT-4、Claude 这种第一梯队比还差点意思。

为了不让自家云服务在 AI 时代掉队，AWS 不得不抱紧 Anthropic 的大腿。通过这种新的按 Token 分成模式，其实也是一种深度绑定：你模型好用，我给你流量，咱们按效果分钱。这比单纯的“我租卡给你”要紧密得多。

3. 另眼相看微软-OpenAI 模式

如果不拿这个去对比微软和 OpenAI 的关系，你就看不懂这步棋。当年微软也是疯狂砸钱给 OpenAI，换算力、换股权。但微软明显在两条腿走路：一边用 OpenAI 的模型武装 Copilot，一边自己疯狂搞小模型（如 Phi-3）和自研大模型。

亚马逊 AWS 与 Anthropic 合作关系示意图

亚马逊与 Anthropic 联手，通过深度绑定弥补自身大模型短板。

现在亚马逊也是同样的套路。虽然现在得依靠 Anthropic，但 AWS 的高层已经放话了，目标是明年推出能达到“前沿水平”的自研模型。这说明什么？说明现在的按 Token 付费，很可能只是一个过渡时期的妥协。

未来的风向标

这个新协议其实给整个行业提了个醒：AI 基础设施的定价权正在发生微妙的变化。

对于云厂商： 以后可能更多会从“卖算力”转向“卖智能成效”。单纯拼显卡堆叠可能不够了，你得能证明你的云环境能让模型跑出更高的 Token 效率。
对于模型厂商： 推理性能的优化不再是 Optional，而是 Mandatory。你的模型如果只是在训练时很强，但推理又慢又贵，在这种按 Token 结算的模式下，根本赚不到钱。

总结

亚马逊这波操作，既是无奈之举，也是精明之算。在面对自研模型短期跟不上的现实面前，用一种更激进的“按结果付费”模式来控制成本、绑定合作伙伴，同时给自己争取追赶的时间。

对于我们关注技术风向的人来说，可以预见的是，未来类似的“混合收费模式”或者“效果挂钩模式”会越来越多。毕竟，在 AI 掘金时代，谁也不想在沙子还没筛出金子的时候，就先把买筛子的钱给亏光了。

咱们且看，明年亚马逊能不能憋出自研的大招，或者Anthropic 会不会在这种模式下进化得更狠。

云服务算计变天？亚马逊 AWS 竟决定按 Token 结算 AI 模型账单

这意味着什么？

未来的风向标

总结

评论已关闭

最新文章

最近回复

分类

归档

其它