Codex Exec 突然变慢？聊聊并发配置与性能调优的实战经验

最近这几天，感觉手里的 Codex Exec 有点“力不从心”了。

不知道大家有没有同感，我一直在用的 gpt-5.4-mini low 模型，以前虽说不上秒回，但也还算丝滑。可就在最近几天，响应速度肉眼可见地慢了下来，甚至有好几次处理实时任务时让人等到没脾气。看着任务列表里堆积的请求，我一度怀疑是不是官方后台对接口进行了限流，或者是我的账号被“针对”了。

API并发请求拥堵示意图

并发请求过多时，后端处理瓶颈可能导致排队延迟和限流

在排除了网络波动和本地设备问题后，我的目光落在了并发设置上。为了追求吞吐量，我之前把并发数拉到了 40，心想这样一来处理大量请求肯定没问题。但这次变慢的经历给了我一个教训：高并发并不等于高效率。

对于大多数 API 服务或代理服务来说，并发设置是一把双刃剑。当并发请求过多时，如果后端服务（这里是 Codex Exec）的处理能力达到瓶颈，或者上游通道出现了拥堵，大量的并发请求反而会导致排队延迟，甚至触发服务的风控机制或限流策略，进一步拖慢整体响应速度。

既然怀疑是并发过高导致的“拥堵”，最直接的调优方案就是降级测试。建议大家可以尝试将并发数先调低，比如从 40 降到 20 甚至 10，观察一下速度是否回升。

调优步骤示意图

逐步降低并发数并进行测试

调优步骤建议：

对于像我这样有大量实时任务需求的人来说，速度往往比单纯的高通量更重要。如果是为了抢时间完成即时生成任务，牺牲一部分并发量来换取更快的首字生成时间（TTFT） 是非常划算的。

目前来看，Codex Exec 这几天的波动可能跟整体负载有关，也可能是针对特定高并发节点的动态调整。大家在遇到类似情况时，不妨先从并发配置入手排查，别让“贪多”反而成了系统的累赘。如果你有更具体的调优经验或发现了其他瓶颈，欢迎在评论区交流，帮大家少走弯路。