最近 AI 圈里最火的概念之一,大概就是“思考模式”或者叫 o1 风格的推理了。各大厂商都在卷这个,号称要展示 AI 的推理过程,让结果更靠谱。本来以为这会是提升办公效率的利器,结果这两天体验了一把 Qwen 3.7 的网页版思考模式,真的是让我气笑了,甚至有点怀疑人生。

这啥玩意?推理还是“左右脑互搏”?

Qwen 3.7 思考模式界面截图展示深度思考进度条

Qwen 3.7 的“深度思考”进度条,原本以为能带来高质量答案。

事情是这样的,我为了测试它的逻辑能力,丢给它一个并不算特别复杂的问题。它很自信地弹出了“深度思考”的进度条,我看它在那儿疯狂输出,心想这次稳了,肯定能有个高质量的答案。

Qwen 3.7 思考过程截图展示自我反驳

所谓的“思考过程”变成了激烈的自我辩论,前半段支持后半段反驳。

结果,当我点开那个所谓的“思考过程”时,我整个人都不好了。这哪是逻辑推演啊,这简直就是一场激烈的自我辩论赛,或者说“左右脑互搏”现场。

在前半段,它言之凿凿地分析了 A 观点,列出了 123 条理由,逻辑严密得让人甚至想给它鼓掌。我以为它要下结论了,结果画风一转,“思考”的后半段突然开始反驳自己:“虽然刚才的观点有道理,但是……”然后列出了一堆为什么 A 观点不对的理由,最后得出了一个和前半段完全相反,甚至稍微带点精神分裂的结论。

不管对不对,先把人整懵了

最搞心态的是,有时候它这顿操作猛如虎,最后给出的答案反而是模棱两可的废话。就像是你问一个朋友中午吃什么,他先是分析了一通碳水与蛋白质的配比,然后痛斥快餐的危害,最后说:“所以我建议你可以吃点东西,也可以不吃。”

这种感觉就是:它似乎在努力思考,但努力的方向可能是在如何说服自己之前的思考是错的。 这种“左右互搏”不仅没有增加我对答案的信任度,反而让我对它的逻辑一致性产生了深深的怀疑。我们希望看到的“思考”,是那种抽丝剥茧、逐步逼近真理的过程,而不是像精神分裂一样在自己的思维迷宫里打转。

为什么会出现这种情况?

虽然体验很搞笑,但从技术角度简单分析一下,这大概也是当前大模型做“思维链”训练的一个副作用。

现在的训练数据里包含了太多的辩论数据和反思数据。模型可能学到了“全面”的特质,觉得既然要思考,就得从正反两方面都考虑一下。结果用力过猛,把“辩证法”用成了“自相矛盾”。它缺乏一个强有力的“仲裁者”模块来在中间做决策,导致正反两方的声音直接展示在了用户面前。

而且,有时候这种“思考”可能还是为了迎合 RLHF(人类反馈强化学习)中的某些偏好——比如展示更多的思考步骤通常被认为是“聪明”的表现。于是模型就学会了“话痨”,不管有没有必要,先思考一番,哪怕是跟自己吵架。

对我们普通用户有什么影响?

如果你平时也喜欢用这些带思考模式的 AI 来辅助工作,我有几个小建议(避坑指南):

  1. 不要过度迷信“过程”: 思考过程展示得再热闹,不代表结果就一定对。特别是像 Qwen 3.7 这种出现前后矛盾的,更要警惕。
  2. 学会“打断”和“引导”: 如果发现它开始左右互搏了,直接在提示词里要求它“给出一个确定的、单方面的结论”,或者限制它的思考视角,不要让它发散得太离谱。
  3. 把它当成“草稿”而不是“终稿”: 这种显式思考模式的输出,更适合用来激发你的灵感,或者帮你查漏补缺。看到它反驳自己的地方,可能正好是你需要去深入核实的地方。

结语

总的来说,Qwen 3.7 这次给我带来的娱乐价值远大于实用价值。看着 AI 在那里一本正经地胡说八道并自我反驳,确实很有节目效果。但如果你是想用它来生成严谨的技术文档或者做决策支持,目前还是得悠着点,多带点自己的判断,别被它那看似“深沉”的思考给忽悠瘸了。

技术进步嘛,总得有个过程,现在的“左右脑互搏”,没准哪天就进化成真正的“深度思维”了。但在那之前,我们先看个乐呵吧。

标签: none

评论已关闭