Codex 代码生成太啰嗦？教你几招优化 AI 编程效率

在现代开发的日常工作中，AI 编程助手已经几乎是标配了。不知道大家有没有遇到过这种情况：当你让 AI 帮忙写一段功能代码时，它不仅给出了核心逻辑，还顺手把一整套并不需要的基础设施、异常处理和注释都塞了进来。结果就是，明明三五行能搞定的事，它生成了几十行代码，甚至引入了一堆根本用不到的依赖。

AI 生成冗长代码的示例对比

AI 生成的代码往往包含过多不必要的注释和异常处理，导致代码量激增。

这其实就是我们常说的“代码生成冗长”问题。最近关于 Codex 在这方面表现的讨论挺多，今天就以此为切入点，聊聊为什么 AI 喜欢写“废话”，以及作为开发者，我们该怎么应对，甚至引导它写出更“性感”的代码。

首先，我们得理解一下大模型生成代码的底层逻辑。 Codex 及其衍生模型（比如某些 IDE 插件背后的驱动力）在海量的开源代码库上训练过。在开源世界里，优秀的代码往往意味着：详尽的注释、完善的错误提示、类型检查以及为了可维护性而设计的各种抽象层。

这就导致了一个现象：模型误判了“好代码”的标准。它觉得把所有可能的边界情况都考虑到、把每一行都解释清楚，才是高质量的回答。但对于一个仅仅是想快速补全一个函数片段的开发者来说，这种“保姆级”输出反而成了负担。

另外，提示词的不明确也是罪魁祸首。如果你只输入“写一个爬虫”，模型的安全机制和丰富联想会让它倾向于生成一个包含 User-Agent 伪装、代理设置、异常捕获的完整爬虫类，而不只是那几行 requests 代码。

开发者优化 AI 提示词的示意图

通过明确指定需求、提供上下文，可以有效引导 AI 生成更精简的代码。

既然知道了原因，解决办法其实就是“调教”提示词和生成策略。这里有几个亲测好用的技巧，大家可以试试：

1. 明确指定“紧凑”和“无注释”

这是最直接有效的方法。在提问时，明确加上限制条件。

通过强调“只要核心逻辑”、“不要额外封装”，能大幅过滤掉那些冗余的辅助代码。

2. 给出上下文而非描述需求

很多时候 Codex 自由发挥是因为它不知道你的项目上下文。如果你直接贴出半段代码让它补全，比用自然语言描述需求生成的代码要精确得多。

例如，你已经写了 def calculate_sum(a, b):，光标停留在这一行，IDE 自动补全通常只会给你 return a + b。而如果你在对话框里问它，它可能会给你写一个带参数校验的复杂版本。利用“少样本”或者直接代码续写模式，能有效抑制它的“创作欲”。

3. 设定 Token 或行数限制

在使用 API 或某些支持参数调整的工具时，可以限制 max_tokens 或者设置输出长度。但这只是一个治标的办法，它可能会把代码截断在莫名其妙的地方。更推荐的组合拳是：限制长度 + 明确要求分步骤实现。

Codex 遇到的问题，其实在目前的 GPT-4 系列、Claude 3.5 Sonnet 等模型上也不同程度存在，只是表现不同。

GPT-4o / Claude 3.5 Sonnet：这两个是目前逻辑能力最强的。相比早期的 Codex，它们更能理解“言外之意”。如果你明确要求“像资深极客一样写代码”，它们往往能给出极其精炼的函数式代码，甚至比你自己写的还要优雅。特别是 Claude 3.5 Sonnet，在遵循具体格式和限制方面表现非常出色，极少出现“自作多情”添加冗余代码的情况。
DeepSeek Coder / StarCoder：这些开源模型在生成速度上很有优势，但在“收敛性”上稍弱。有时候会生成一些莫名其妙的 import 语句。不过，通过调整 temperature 参数（设低一点），可以让它们的输出更收束，减少废话。

AI 生成代码冗长，本质上是因为它被训练得“太客气”了。它想给你提供一个完美的解决方案，却忽略了我们在当下场景最需要的可能只是那几行核心逻辑。

解决这个问题，不需要换掉工具，只需要优化我们的提问方式：多给代码上下文，少给模糊的自然语言描述；多加强制性约束（如无注释、特定格式），少给开放式问题。当然，如果你的预算允许，尝试切换到更新一代的模型（如 Claude 3.5），可能会给你带来惊喜的体验。

希望这些小技巧能帮你节省下筛选 AI 废话代码的时间，把精力真正花在业务逻辑的构建上。