体验了 Sonnet 5 几小时,劝你别急着换掉 Opus
最近圈子里的热度都在谈论新版模型的更新,我也没忍住,趁着这股热乎劲,花了几个小时深度体验了一把大家都在推的那个 Sonnet 5。作为平时靠 AI 辅助开发的代码民工,我想从实战的角度,聊聊这几分钟速成课带给我的真实感触——如果你正打算把主力模型切过去,建议先看完这篇避避坑。
第一小时:感觉像坐上了高铁
刚开始上手的那一个小时,我是真有点“惊喜”的。
我主要是拿它来干一些开发过程中的脏活累活:查查 API 文档里的参数,写几个简单的部署脚本,或者把代码推到生产环境。这类工作不需要太复杂的逻辑推理,属于典型的“命令行规模”任务。
给我的感觉就是:快!真的快!比之前用的 Opus 跑起来轻快了不少,几乎没有响应延迟。而且对于这种轻量级任务,它给出的答案也没啥大毛病,逻辑通顺,代码能跑。那一刻我甚至产生了错觉:这就是升级版的 Sonnet 4.6 吧?平衡感好像找回来了。
第五小时:翻车现场来得太快
然而,这种良好的自我感觉在第五个小时被彻底打破。
当时我遇到一个稍微核心一点的活儿:需要去梳理一个之前用 Opus 写好的老项目逻辑,并生成一个流程图。这其实是一个很典型的“理解上下文 + 产出指定格式”的任务。我想着既然 Sonnet 5 这么快,处理这种中等难度的活应该没问题吧?
结果,我错了。而且错得离谱。
在让它修改已有产出的逻辑时,它表现得非常“拧巴”。它似乎听不懂“基于现有代码修改”这个指令,非要自己另起炉灶,尝试各种新方法。我明确要求它画图,结果它给我试了 5 种不同的格式,就是不肯老老实实按照项目现有的逻辑去梳理。
Sonnet 5 未能正确生成的 Mermaid 流程图示例
最让人抓狂的是指令遵从度的问题。我在 Prompt 里黑体字加粗地写着:“请生成 Mermaid Markdown 格式”,结果它倒好,坚持给我输出 SVG 代码。这种“自作主张”的劲头,在需要严格格式控制的开发场景下,简直是灾难。改了五次都没改对,最后我实在受不了了,切回 Opus,原本复杂的逻辑梳理和画图工作,一把就直接搞定了。
总结:快不等于强
这几小时的折腾让我对现在的模型分级有了更清醒的认识:
- Sonnet 5 的定位:它确实很快,对于那些碎片化的、不需要深度推理的小活(比如查数据、写简单脚本、零散代码补全),它用起来很顺手,像一把锋利的瑞士军刀。
- Opus 的不可替代性:一旦涉及到复杂项目的重构、严格的逻辑梳理或者对输出格式有死板要求时,Opus 的“思考深度”依然是 Sonnet 5 比不了的。后者可能会因为太想表现自己的“创造力”,而忽略了用户最基本的指令。
给各位兄弟的建议是:日常搬砖可以用 Sonnet 5 来提速,省点 token 和时间;但遇到硬骨头、核心逻辑重构或者必须 100% 准确执行指令的时候,Opus 依然是你最值得信赖的“老伙计”,别轻易换主力。

评论已关闭