Qwen 3.7 思考模式实测：这是“左右脑互搏”还是逻辑分裂？

最近 AI 圈里最火的概念之一，大概就是“思考模式”或者叫 o1 风格的推理了。各大厂商都在卷这个，号称要展示 AI 的推理过程，让结果更靠谱。本来以为这会是提升办公效率的利器，结果这两天体验了一把 Qwen 3.7 的网页版思考模式，真的是让我气笑了，甚至有点怀疑人生。

Qwen 3.7 思考模式界面截图展示深度思考进度条

Qwen 3.7 的“深度思考”进度条，原本以为能带来高质量答案。

事情是这样的，我为了测试它的逻辑能力，丢给它一个并不算特别复杂的问题。它很自信地弹出了“深度思考”的进度条，我看它在那儿疯狂输出，心想这次稳了，肯定能有个高质量的答案。

Qwen 3.7 思考过程截图展示自我反驳

所谓的“思考过程”变成了激烈的自我辩论，前半段支持后半段反驳。

结果，当我点开那个所谓的“思考过程”时，我整个人都不好了。这哪是逻辑推演啊，这简直就是一场激烈的自我辩论赛，或者说“左右脑互搏”现场。

在前半段，它言之凿凿地分析了 A 观点，列出了 123 条理由，逻辑严密得让人甚至想给它鼓掌。我以为它要下结论了，结果画风一转，“思考”的后半段突然开始反驳自己：“虽然刚才的观点有道理，但是……”然后列出了一堆为什么 A 观点不对的理由，最后得出了一个和前半段完全相反，甚至稍微带点精神分裂的结论。

最搞心态的是，有时候它这顿操作猛如虎，最后给出的答案反而是模棱两可的废话。就像是你问一个朋友中午吃什么，他先是分析了一通碳水与蛋白质的配比，然后痛斥快餐的危害，最后说：“所以我建议你可以吃点东西，也可以不吃。”

这种感觉就是：它似乎在努力思考，但努力的方向可能是在如何说服自己之前的思考是错的。 这种“左右互搏”不仅没有增加我对答案的信任度，反而让我对它的逻辑一致性产生了深深的怀疑。我们希望看到的“思考”，是那种抽丝剥茧、逐步逼近真理的过程，而不是像精神分裂一样在自己的思维迷宫里打转。

虽然体验很搞笑，但从技术角度简单分析一下，这大概也是当前大模型做“思维链”训练的一个副作用。

现在的训练数据里包含了太多的辩论数据和反思数据。模型可能学到了“全面”的特质，觉得既然要思考，就得从正反两方面都考虑一下。结果用力过猛，把“辩证法”用成了“自相矛盾”。它缺乏一个强有力的“仲裁者”模块来在中间做决策，导致正反两方的声音直接展示在了用户面前。

而且，有时候这种“思考”可能还是为了迎合 RLHF（人类反馈强化学习）中的某些偏好——比如展示更多的思考步骤通常被认为是“聪明”的表现。于是模型就学会了“话痨”，不管有没有必要，先思考一番，哪怕是跟自己吵架。

如果你平时也喜欢用这些带思考模式的 AI 来辅助工作，我有几个小建议（避坑指南）：

不要过度迷信“过程”： 思考过程展示得再热闹，不代表结果就一定对。特别是像 Qwen 3.7 这种出现前后矛盾的，更要警惕。
学会“打断”和“引导”： 如果发现它开始左右互搏了，直接在提示词里要求它“给出一个确定的、单方面的结论”，或者限制它的思考视角，不要让它发散得太离谱。
把它当成“草稿”而不是“终稿”： 这种显式思考模式的输出，更适合用来激发你的灵感，或者帮你查漏补缺。看到它反驳自己的地方，可能正好是你需要去深入核实的地方。

总的来说，Qwen 3.7 这次给我带来的娱乐价值远大于实用价值。看着 AI 在那里一本正经地胡说八道并自我反驳，确实很有节目效果。但如果你是想用它来生成严谨的技术文档或者做决策支持，目前还是得悠着点，多带点自己的判断，别被它那看似“深沉”的思考给忽悠瘸了。

技术进步嘛，总得有个过程，现在的“左右脑互搏”，没准哪天就进化成真正的“深度思维”了。但在那之前，我们先看个乐呵吧。