Codex离谱翻车？AI“幻觉”背后的真相，竟是上下文作祟？

最近在折腾代码的时候，碰到了一件让人哭笑不得的事。

明明给了Prompt让AI写个简单的函数，结果它不仅没写对，还一本正经地胡说八道，甚至发明了一些根本不存在的库和方法。这就是大家常说的AI“幻觉”（Hallucination）。尤其是OpenAI的Codex系列，平时用着挺顺手，这次怎么突然“脑抽”了？

Codex代码生成错误的界面截图

Codex产生幻觉，生成了离谱且不存在的代码

很多朋友遇到这种情况第一反应是：“难道是模型抽风了？”或者“是不是我RP（人品）不好？”

其实，这背后往往有技术原因。特别是当我们觉得这次的代码输出“离谱”到完全不像平时水平时，罪魁祸首很有可能就是——上下文（Context）太长导致的信息压缩。

现在的AI大模型虽然厉害，但它们的一次性“工作记忆”也就是Context Window是有限的。当你把几百上千行代码、文档或者之前的对话记录都一股脑丢给它作为Prompt时，模型就需要在有限的窗口里处理这些信息。

这里有个关键点：注意力机制和经济性。

为了处理超长上下文，尤其是超过了模型最佳处理区间的长度，模型或者中间层可能会对信息进行一种“有损压缩”。你可以把这就想象成“传声筒”游戏：

简单说，它可能没看清你的核心需求，只记住了大概的氛围，最后硬编了一个看起来像那么回事，实际全是Bug的代码。

既然知道了问题可能出在“上下文过长”和“压缩”上，我们就有办法应对。下次如果Codex或者其他AI开始胡言乱语，别急着骂它笨，试试下面几个解决方案：

这是最直接有效的方法。检查一下你的Prompt，是不是把整个项目的代码都贴进去了？

不要试图让AI一口吃成个胖子。

不要指望AI能猜透你的心思，它要是能猜透，就不会有幻觉了。

有些模型确实在长上下文处理上比其他模型更强（比如有些专门优化了128K甚至更大Context的模型）。

Codex这种“离谱”的幻觉现象，大概率不是它有了自我意识在反抗人类，而是由于上下文太长导致的信息过载和压缩失真。

做AI辅助开发，其实也是在教AI怎么工作。学会管理上下文，学会精简Prompt，不仅能减少幻觉，还能大大提高我们的开发效率。下次再碰到AI发疯，先问问自己：“我是不是喂给它的东西太多了？”