早上起来也是没忍住,趁着夜深人静,赶紧把那个传闻中的 Fable 5 掏出来试了试水。

Fable 5 界面截图

Fable 5 的深度体验界面

这两个小时的深度体验下来,我只能说:那个熟悉、强大且让人惊喜的“老朋友”,他真的回来了。

选对 Mode 很重要,不用死磕 Max

进圈子的小伙伴都知道,现在跑这种大模型,不同档位的计算量差异巨大。一开始我也在纠结是用哪个模式比较好,毕竟 token 都是钱,烧不起啊。随手拿了一道经典的逻辑题(俗称“糖果题”)来测底。

逻辑推理测试

不同模式下的逻辑推理能力对比

实测下来,Max 模式虽然听起来最诱人,但有时候容易想太多,反而有点过度思考,关键是非常消耗额度。相比之下,X-high 这个档位简直是目前的“性价比之神”,逻辑清晰,响应够快,完全够用。至于小水管什么的,就别拿来折腾重型任务了,容易崩。

真·全自动:我甚至不需要摸鱼

为了压测一下 Fable 5 的真实落地能力,我直接甩给它一个硬骨头:全局项目月度维护

这个任务包含了整整 9 个子项目,涉及的文档散落在项目的各个角落。我直接对着麦克风语音“喷”了一遍我的需求,然后告诉它:“你自己去翻文档,遇到不懂的再来问我。”

结果呢?它压根没问我(没 grill 我)。这意味着它不仅听懂了人话,还能快速理解上下文,直接进入计划模式。我看了一眼它生成的 Plan,逻辑闭环,甚至比我预想的还要周详,只是我在几个细节上稍微按了一下它,它就开始跑了。

跑了这一阵子,基本不需要我介入什么。最爽的是,它在完成每个任务时都会留下一份阶段性中间记录。我抽查了一下,完成度不仅符合预期,有几个点甚至做得比我预想的还要好。那种“丢给它就不用管”的爽感,真的是久违了。

技术风向分析:这是“满血版”回归吗?

这里就要聊一点八卦加分析了。用 Fable 5 的感觉,太像最早期那个 Opus 4.6 了。那种自信、强大、偶尔给点小惊喜的智能感,是后续 4.7 和 4.8 版本上丢失了很久的东西。

大家心里都清楚,商业公司不可能上来就王炸。我有理由怀疑,Fable 5 的内核其实就是当年的满血版 Opus 4.6

背后的逻辑可能是这样的:Anthropic 当初为了商业节奏,先把满血版做了阉割,放出了弱智版的 4.6,然后像挤牙膏一样,一步步通过 4.7、4.8 试探市场情绪和算力成本。现在时机到了,为了应对竞争,终于把这颗早就打磨好的“满血版 4.6”换了个壳子放出来了。

虽然这听起来有点“阴谋论”,但作为重度使用者,这种体验上的既视感太强烈了。

总结

如果你手里有 Fable 5 的额度,别犹豫,直接上 X-high 模式去跑你的复杂任务。它不再是那个需要你步步引导的“助手”,更像是一个能独立执行、甚至能给你惊喜的“合作者”。

这波羊毛和技术风向,建议大家都薅一下,真的有点东西。

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭