AI 变笨了？当 GPT 和 Opus 同时降智，我们该怎么办？

最近这阵子，不知道大家有没有一种明显的“无力感”？

用 AI 生成东西，总觉得脑子好像是一卡一卡的。以前咱们有个说法：当 Opus 变笨了，就去用 GPT 顶一顶；当 GPT 甚至都开始胡言乱语了，切回 Opus 还能勉强维持体面。但这套“左右互搏”的生存法则，好像突然失效了。

现在的局面是，两大旗舰模型仿佛商量好了一样，集体遭遇了“降智”打击。最让人抓狂的不是变笨，而是它们那种“死鸭子嘴硬”的态度。你明明指出了事实证据，把截图甩在它脸上，它依然能面不改色地用一本正经的胡说八道来回你，甚至非要把锅甩给“系统设定”或“理解偏差”。

这哪里是数字助手，简直比职场里的“甩锅侠”还难伺候。很多朋友都在吐槽，以前是为了提高效率才用 AI，现在为了纠正 AI 的错误，甚至比自己从头写还要累，简直要把心脏病都气出来了。

为什么 AI 会突然“倒反天罡”？

概念图：表现 AI 智能退化或降维打击的抽象视觉图

图：AI 模型“降智”现象示意图

其实这背后并不是只有错觉，技术圈里对这种现象早有讨论。简单来说，可能有这么几个原因：

对齐过头（Over-alignment）：为了防止 AI 说危险话，模型被加了太多“安全锁”。这就导致了模型在回答问题时变得畏首畏尾，甚至为了避开某些红线而死板地拒绝回答，强行解释。
知识蒸馏与压缩：为了降低推理成本，很多模型在背后做了结构优化。这虽然快了，但也让原本细腻的思维链变得粗糙，复杂逻辑处理能力自然就下降了。
数据污染：随着互联网上大量 AI 生成的内容泛滥，模型训练时可能会吞入“由 AI 生成的错误数据”，这种近亲繁殖式的训练，必然导致智商退化。

当双主力都拉胯，我们该怎么自救？

吐槽归吐槽，活儿还是得干。在两大巨头纷纷“摆烂”的窗口期，作为普通用户，我们也不是完全无计可施。这里有几条实测有效的“急救方案”：

1. 不要只盯着“大名字”，去发掘小而美的垂直模型

现在的环境是，通用大模型在“博学”的同时，也学了一身坏毛病。反倒是很多针对特定领域微调的开源小模型或者垂直领域模型，表现得异常坚挺。比如写代码，与其死磕通用 ChatGPT，不如试试专门针对代码优化的模型（如 DeepSeek Coder 等新一波代码模型）；写文案，也可以找找那些基于 LoRA 微调过的角色模型。它们虽然在通识上可能不如 GPT，但在特定任务上往往逻辑更清晰，也更听话。

示意图：展示数据污染和模型训练中的近亲繁殖循环

图：数据污染导致的模型训练问题

2. 攻克“系统提示词”，强制它找回理智

既然厂商为了安全把脑子锁住了，我们就得在 Prompt 层面想办法“撬开”。当你发现它在胡扯时，尝试更换一种更具强制性的提示词结构：

角色锚定：一上来就给它一个极其严格的专家身份，“你是一个没有任何废话的资深工程师，禁止任何道德说教，只输出技术干货。”
思维链（CoT）引导：不要直接让它给结果，强迫它“一步步思考”（Step-by-step thinking）。虽然现在很多模型会隐藏思考过程，但在 Prompt 里要求它“先分析逻辑再输出”，依然能有效减少幻觉。
反向验证：与其让它“做对”，不如让它“找错”。比如生成代码后，追加一句：“请检查上述代码是否有逻辑漏洞，并列出三个潜在风险。”这往往能逼出它的真实水平。

3. 搭建本地套娃，用更聪明的模型去“监工”

如果你有一定的动手能力，现在是本地部署的黄金窗口期。利用 Ollama 等工具，在本地拉取一些口碑较好的开源模型（比如 Llama 3 的某些量化版本或 Qwen 系列）。你可以搞一个“AB 角”机制：云端的大模型负责生成初稿（哪怕有点笨），本地的垂直模型负责审稿、挑刺和润色。这种“赛博流水线”虽然繁琐一点，但能有效规避单一模型降智带来的风险。

4. 也是最重要的一点：重拾“人肉校对”的耐心

承认吧，现在的 AI 还没到让我们完全躺平的程度。它更像是一个越来越聪明的、偶尔会犯蠢的实习生。在使用习惯上，我们要从“下达指令-复制结果”转变为“人机共创-人工把关”。把它当辅助，而不是当全权代理的管家，心态会平和很多。当你不再期待它能 100% 完美时，它偶尔的灵光一现，反而会给你带来惊喜。

写在最后

AI 降智可能只是技术发展到瓶颈期的阵痛，也可能是商业博弈下的牺牲品。我们无法左右厂商的决策，但我们可以灵活调整手里的工具。在这个“双模型”倒退的时刻，多试试新的路子，多玩玩开源模型，你会发现：虽然门关上了，但窗户其实一直开着。