体验了 Sonnet 5 几小时，劝你别急着换掉 Opus

最近圈子里的热度都在谈论新版模型的更新，我也没忍住，趁着这股热乎劲，花了几个小时深度体验了一把大家都在推的那个 Sonnet 5。作为平时靠 AI 辅助开发的代码民工，我想从实战的角度，聊聊这几分钟速成课带给我的真实感触——如果你正打算把主力模型切过去，建议先看完这篇避避坑。

作者头像

第一小时：感觉像坐上了高铁

刚开始上手的那一个小时，我是真有点“惊喜”的。

我主要是拿它来干一些开发过程中的脏活累活：查查 API 文档里的参数，写几个简单的部署脚本，或者把代码推到生产环境。这类工作不需要太复杂的逻辑推理，属于典型的“命令行规模”任务。

给我的感觉就是：快！真的快！比之前用的 Opus 跑起来轻快了不少，几乎没有响应延迟。而且对于这种轻量级任务，它给出的答案也没啥大毛病，逻辑通顺，代码能跑。那一刻我甚至产生了错觉：这就是升级版的 Sonnet 4.6 吧？平衡感好像找回来了。

第五小时：翻车现场来得太快

然而，这种良好的自我感觉在第五个小时被彻底打破。

当时我遇到一个稍微核心一点的活儿：需要去梳理一个之前用 Opus 写好的老项目逻辑，并生成一个流程图。这其实是一个很典型的“理解上下文 + 产出指定格式”的任务。我想着既然 Sonnet 5 这么快，处理这种中等难度的活应该没问题吧？

结果，我错了。而且错得离谱。

在让它修改已有产出的逻辑时，它表现得非常“拧巴”。它似乎听不懂“基于现有代码修改”这个指令，非要自己另起炉灶，尝试各种新方法。我明确要求它画图，结果它给我试了 5 种不同的格式，就是不肯老老实实按照项目现有的逻辑去梳理。

Mermaid 流程图示例

Sonnet 5 未能正确生成的 Mermaid 流程图示例

最让人抓狂的是指令遵从度的问题。我在 Prompt 里黑体字加粗地写着：“请生成 Mermaid Markdown 格式”，结果它倒好，坚持给我输出 SVG 代码。这种“自作主张”的劲头，在需要严格格式控制的开发场景下，简直是灾难。改了五次都没改对，最后我实在受不了了，切回 Opus，原本复杂的逻辑梳理和画图工作，一把就直接搞定了。

总结：快不等于强

这几小时的折腾让我对现在的模型分级有了更清醒的认识：

Sonnet 5 的定位：它确实很快，对于那些碎片化的、不需要深度推理的小活（比如查数据、写简单脚本、零散代码补全），它用起来很顺手，像一把锋利的瑞士军刀。
Opus 的不可替代性：一旦涉及到复杂项目的重构、严格的逻辑梳理或者对输出格式有死板要求时，Opus 的“思考深度”依然是 Sonnet 5 比不了的。后者可能会因为太想表现自己的“创造力”，而忽略了用户最基本的指令。

给各位兄弟的建议是：日常搬砖可以用 Sonnet 5 来提速，省点 token 和时间；但遇到硬骨头、核心逻辑重构或者必须 100% 准确执行指令的时候，Opus 依然是你最值得信赖的“老伙计”，别轻易换主力。

体验了 Sonnet 5 几小时，劝你别急着换掉 Opus

第一小时：感觉像坐上了高铁

第五小时：翻车现场来得太快

总结：快不等于强

评论已关闭

最新文章

最近回复

分类

归档

其它