Claude 模型实测省钱攻略：Sonnet 5 真的比 Opus 便宜吗？

大家好，最近在用 AI 子代理跑一些自动化开发任务，原本想着用号称“性价比之王”的 Claude Sonnet 5 来代替昂贵的 Opus，省点算力钱。结果跑了几天一看账单，不仅没觉得便宜，甚至体感上还更费钱。

为了搞清楚是不是我的使用姿势不对，我干脆找了个真实的业务场景，把 Opus 4.8、Sonnet 5（目前的尝鲜价）和 Sonnet 4.6 拉出来做了一次横向对比。测试任务是基于确定的 PRD（产品需求文档）和 Spec（技术规范），effort 都设置为 high，看看大家在完成同样质量任务时的真金白银到底差多少。

🔍 先看报价（每百万 Token 价格）

在晒数据之前，先科普一下它们的官方单价（单位：美元/MTok）

模型	输入	缓存写入	缓存读取	输出
Opus 4.8	$5.00	$6.25	$0.50	$25.00
Sonnet 5	$2.00	$2.50	$0.20	$10.00
Sonnet 4.6	$3.00	$3.75	$0.30	$15.00

价格对比表格展示各模型单价

各模型官方单价对比

注：Sonnet 5 目前是 intro 价（截止到 2026-08-31），标准价其实跟 Sonnet 4.6 一样，是 Opus 的 60% 左右。

看着是不是觉得 Sonnet 5 香爆了？单价几乎是 Opus 的 1/3 到 1/2。别急，咱们看实测数据。

📊 实测数据大揭秘

我选取了两个不同复杂度的任务（分别标记为 B 轨和 F 轨），在质量要求相当的情况下，跑出了下面的数据。

任务 B（复杂度较高）

Opus 4.8：耗时 421s，总成本 $5.99，API 调用 105 次。
Sonnet 5：耗时 524s，成本 $3.72（尝鲜价）/$5.58（标准价），API 调用 153 次。
Sonnet 4.6：耗时 774s，成本 $5.83，API 调用 160 次。

分析： 在这个任务里，Opus 是最快的，只用了 7 分钟左右。Sonnet 5 虽然靠折扣拿到了 $3.72 的低价，但它比 Opus 多跑了近 50% 的 API 调用次数！如果按标准价算，它的 $5.58 甚至比 Opus 还贵。最惨的是 Sonnet 4.6，不仅慢（快 13 分钟了），而且并没有比 Opus 便宜多少。

任务 F（常规复杂度）

Opus 4.8：耗时 410s，总成本 $3.43，API 调用 77 次。
Sonnet 5：耗时 505s，成本 $2.30（尝鲜价）/$3.45（标准价），API 调用 91 次。
Sonnet 4.6：耗时 489s，成本 $2.94，API 调用 83 次。

分析： 这个任务下，Sonnet 5 凭借尝鲜价确实赢了，成本 $2.30。但请注意标准价那一栏（$3.45），它和 Opus 的 $3.45 几乎一模一样！而在耗时上，Opus 再次吊打全场，比 Sonnet 系列快了近 1.5 到 2 分钟。

💡 为什么“低价”没带来“低账单”？

这里的核心原因在于 “缓存读取”和“轮次效率”。

你会发现，虽然 Sonnet 单价便宜，但它在处理复杂逻辑时，往往需要更多的 Tool Calls（工具调用）和对话轮次来“磨”出结果。更多的轮次意味着大量的 Prompt B 缓存被反复读取。虽然缓存读取单价很便宜，量变引起质变，最终把单价的优势给抹平了。

而在有详细 PRD 和 Spec 约束的前提下，三个模型跑出来的代码质量和逻辑其实 差别不大。既然结果差不多，谁跑得快、谁更省心，谁就是赢家。

🚀 结论：该怎么选？

经过这次实测，我目前的结论很明确：大部分需要 AI 子代理执行的开发任务，直接上 Opus 4.8 可能是更优解。

效率至上：Opus 的推理能力更强，不需要太多的来回拉扯，一步到位的概率更高，节省了大量时间。
成本陷阱：Sonnet 5 的“低价”目前完全依赖折扣期。一旦 2026 年折扣取消，按照标准价算，它的实际成本和 Opus 持平，甚至因为耗时更长而显得“隐形昂贵”。
Sonnet 4.6：目前看来比较尴尬，既没有价格优势，速度也慢，暂时不推荐作为主力模型。

当然，如果你的任务非常简单，不需要复杂的多轮工具调用，Sonnet 5 在折扣期内依然是“真香”的选择。但如果你是在构建复杂的 Agent 工作流，追求的是高效率和确定的交付，别犹豫，放手用 Opus 吧，省下来的时间成本也是钱啊！

希望这次踩坑实测能帮大家在模型选择上少走弯路！