GPT 变懒不干活？中转服务工具调用故障排查指南

最近很多使用 GPT 的朋友都在吐槽同一个问题：AI 突然变懒了？

明明以前活儿干得挺好，最近却变得惜字如金，问什么都是简短回复。更让人抓狂的是，让它联网搜索、读个文档或者调用个工具，它嘴上答应得好好的（“好的，这就为您处理”），结果啥也不干，直接摆烂。

如果你也是连续换了几个中转服务，聊了十几轮还没把一个文档读完，那大概率不是你的 Prompt 写得太烂，而是别的地方出了问题。今天就来聊聊这是什么情况，以及咱们普通用户能怎么救。

AI 变懒不干活的概念图

AI 变懒了？可能是中转服务在搞鬼。

为什么你的 AI 开始“摆烂”？

遇到这种情况，第一反应往往是“是不是账号被封了？”或者“是不是我欠费了？”。其实，大多数时候问题出在API 中转服务或者模型策略上。

1. 中转服务的参数“阉割”

这是最常见的原因。现在市面上很多廉价的第三方中转，为了节省成本，会在 OpenAI 原生 API 参数上动歪脑筋。

Max Tokens 被设得太低： 如果 max_tokens 参数被限制得很死，模型还没说完一段话或者还没来得及输出工具调用的 JSON 结构，字数就超限了。结果就是你看到了一句简短的结束语，而工具调用直接被截断。
System Prompt 被篡改： 有些中转为了防止模型输出违规内容，会在系统层强行塞入一个“安全指令”。这个指令可能会覆盖你的工具调用定义，导致模型在“听你的”和“听中转商的”之间打架，最后选择什么都不干。

2. 模型的“懒惰”策略

从 GPT-4 Turbo 后期版本开始，官方模型确实出现过“变懒”的倾向。OpenAI 专门针对这个问题出过修复补丁。如果你的中转商使用的模型版本非常老旧，或者是某个特定的“偷懒”版本，那你确实会因为模型本身的策略而遭遇敷衍了事的回复。

3. 温度与采样率的误判

如果你使用的是中转服务，有时候默认的温度参数会被调得极低（接近 0）。低温度会让模型的回答变得非常保守和单一。对于工具调用这种需要严格格式输出的任务，低温度是好事；但如果低到极点，模型可能会倾向于结束对话而不是执行复杂的生成任务。

实操排查：三招解决“不干活”

既然问题大概率出在通道或参数上，我们不用改代码，试试这几招“非正常”手段。

第一招：强制重置“上下文”

“我已经跟它交流 10 轮以上了，就让它读一个文档。”

长对话是工具调用的大忌。

排查工具调用故障的示意图

遇到问题，按这三招排查。

当对话轮次过多，上下文窗口会被大量无意义的聊天记录填满。模型在这个时候的注意力机制会非常混乱，特别是对于复杂的工具定义，它在长长的历史记录里可能已经“忘了”怎么用工具了。

解决方案： 开个新对话。这是成本最低、效果最立竿见影的方法。不要试图在一个对话框里聊完天再让它干活，新开一个会话，直接把需求喂给它，不要废话。

第二招：检查中转是否有“偷懒”迹象

如果你是新对话依然不行，那就得怀疑你的中转 API 代理了。

对比测试： 如果你手头有官方直连的账号（或者另一个口碑好的中转），用完全相同的 Prompt 和文档去测试。如果直连能用工具，而你的中转不能用，那就 100% 是中转的问题，果断换一家。

第三招：手动“提权”你的 Prompt

当不确定后端 Max Tokens 是多少时，我们可以通过修改提问方式来“欺骗”模型，强制它输出更长的内容或结构。

不要说：“帮我读一下这个文档。”

试着说：

“请逐步阅读这个文档。第一步，列出大纲；第二步，详细总结内容；第三步，输出结果。在开始之前，请先告诉我你将调用哪个工具，并展示工具调用的完整参数。”

这种“分步引导”+“强制输出思考过程”的方法，有时能绕过模型某些“偷懒”的预设，迫使它把工具调用给吐出来。

总结与建议

GPT 突然变懒、不调用工具，通常不是你个人的玄学问题，而是中转服务的成本控制或模型版本滞后导致的。

对于普通用户来说，遇到长轮次对话失效，首选“开新窗”；遇到新对话也摆烂，赶紧“换渠道路”。 别在一个失效的 API 上浪费时间，现在的中转服务商多如牛毛，多做几次 A/B 测试，总有一家是老实干活的。

希望这篇排查指南能帮你省点头发，下次遇到 AI 摸鱼，直接按这几步操作就行！