OpenAI 算力又崩了？报错 'Selected model is at capacity' 出现时的应对指南

最近这段时间，不知道大家有没有感觉到，ChatGPT 或者是 OpenAI 的 API 接口似乎又变得“娇气”起来了？

好几次想趁着灵感爆发赶紧跟 AI 聊两句，结果屏幕上冷冰冰地弹出一行英文：“Selected model is at capacity. Please try a different model”（所选模型已满载，请尝试其他模型）。

这已经不是第一次了，这种无限卡顿和报错确实挺搞心态的。今天咱们不聊别的，就来专门唠唠这事儿，看看到底是怎么回事，以及在官方“挤牙膏”修好之前，我们普通用户能有哪些应对的办法。

OpenAI 报错界面示意图

'Selected model is at capacity' 错误提示

说实话，出现这种“算力不足”的提示，核心原因其实很简单：用的人太多，服务器顶不住了。

这可能源于几个方面：

新上线的模型太火： 每当 OpenAI 发布或者稍微放宽某些新模型（比如 o1 系列或者 GPT-4o 的某些高级功能）的限制时，大量用户会涌入尝鲜，瞬间导致服务器负载激增。
区域性的波动： 有时候并不是全球都崩，而是你所在的网络节点或者地区出现了拥堵。
付费用户的优先级： 很多人吐槽，有时候明明是付费 Plus 会员，却依然报错。但在高负载情况下，即便是付费用户的排队机制也可能出现延迟。

总之，这就是典型的“供需不平衡”——大家对 AI 的需求在指数级增长，但 GPU 算力的扩产速度显然还没跟上大家的热情。

看着那个红色的错误提示干瞪眼没用，咱们得主动出击。这里有几个实测有效的临时解决方案，大家可以按顺序试一试：

ChatGPT 模型选择菜单

切换到 GPT-3.5 或其他轻量级模型

报错信息里其实已经给出了解决方案：“Please try a different model”。

如果非得用最强的 GPT-4 或 o1 模型，那可能得等一等。但如果任务不是特别复杂（比如简单的翻译、润色、写个周报），完全可以暂时切回 GPT-3.5 或者 GPT-4o-mini。这些轻量级模型通常有更大的算力冗余，响应速度也更快，对于日常轻量级任务完全够用。

这招虽老但管用。有时候报错只是一瞬间的网络抖动或队列分配失败。点击“重新生成”或者刷新一下网页，有时候就能奇迹般地连上去了。建议每次间隔几秒钟，不要频繁狂点，否则可能会触发风控导致暂时封禁。

虽然 AI 是 24 小时待命，但人类的使用习惯是有规律的。通常在工作日的上午 9 点到 11 点，下午 2 点到 5 点，或者是晚上 8 点到 10 点，是使用高峰期。如果可以，试着在深夜或者凌晨的时候处理重负荷的任务，那时候通畅率通常高得多。

如果 OpenAI 这边确实一直挤不进去，或者你是重度用户，严重影响工作效率了，不妨考虑一下其他的路线，不要在一棵树上吊死。

Claude 3.5 Sonnet： 目前公认综合能力最接近 GPT-4 的模型之一，尤其是在写作和代码审查方面表现非常出色，且目前的可用性相对好一些。
国产大模型： 比如月之暗面、文心一言、通义千问等。经过这一年的迭代，国产模型在中文语境理解和长文本处理上已经有了长足的进步，处理中文任务有时比 GPT 还要顺手。
Local LLM（本地部署）： 如果你有一张显卡尚可的电脑（比如 NVIDIA 4060 以上），可以试试用 Ollama 或 LM Studio 部署本地模型（如 Llama 3）。虽然知识库可能会旧一点，但胜在完全免费、隐私安全且没有算力限制。

这次 OpenAI 的算力告急，再次提醒我们：虽然 AI 很强，但基础设施依然是瓶颈。

作为用户，我们无法控制服务器那边的开关，但我们可以通过灵活切换工具、调整使用习惯来最大化自己的效率。希望这次的问题能早点解决，也欢迎大家分享一下你们最近遇到的具体情况，看看是不是只有我一个人在疯狂踩雷。