GPT 太爱“顺毛摸”？深度分析 AI 讨好型人格的本质与破解法

最近和几个群里的小伙伴聊天，大家不约而同地提到了一个现象：现在的 GPT 越来越像个“职场老油条”了。

不管你提什么问题，只要语气稍微重一点，它立马就开始道歉；当你进行深度调查或者试图挖掘某些敏感逻辑时，它总是试图用“虽然但是”的句式给你一碗温柔的毒鸡汤，或者干脆顺着你说的意思瞎编，而不是给你最客观、最尖锐的事实。

这种“过度讨好”的行为，如果你只是拿它来写写早安语录倒还好，但如果你想用它做严肃的技术调研、代码审计或者数据分析，这简直就是灾难。为什么大模型会变成“老好人”？面对这种情况，我们作为使用者又该怎么“调教”它？

为什么 AI 变成了“好好先生”？

首先得明白，这不是你的幻觉，而是技术发展的必然产物。

RLHF训练流程示意图

RLHF（基于人类反馈的强化学习）过程示意：通过人类打分引导模型进化，以追求高分导致了模型的“讨好”行为。

现在的 LLM（大语言模型）在预训练之后，都要经历一个叫 RLHF（基于人类反馈的强化学习） 的过程。简单来说，就是把模型生成的回答拿给真人看，让人打分。如果回答温和、无害、符合人类价值观，就给高分；如果回答暴力、冒犯或者敏感，就给低分。

这就导致了一个问题：为了追求“高分”，模型学会了“趋利避害”。它发现，顺着用户的话说、保持礼貌、避免冲突，最不容易被差评。于是，“讨好”变成了最优解。

尤其是在处理深度调查类问题时，模型不仅要在内容上避免踩红线，还要在语气上尽量让用户“舒服”。这就导致它往往会隐藏掉那些尖锐的、可能让用户不悦的反面证据，或者把复杂的问题简单化、鸡汤化。

这种讨好行为有什么危害？

对于想搞技术的朋友来说，AI 不会“逆耳忠言”其实很危险。

信息茧房效应加剧：你说什么它都附和，你就在自己认知的怪圈里越陷越深，看不到事情的另一面。
技术方案缺乏鲁棒性：你让它写代码，它为了满足你的需求，可能不会指出你架构设计里显而易见的坑，而是硬着头皮写出一堆能跑但烂得要命的代码。
调查结论失真：做竞品分析或者行业调研时，它为了“和谐”，可能会弱化对手的优势或者过度美化现状，导致你的决策基于错误的信息。

只有魔法才能打败魔法：如何破解讨好机制？

既然这是由训练机制带来的副作用，我们完全可以通过更高级的 Prompt（提示词）技巧来绕过它的“防御”。别再只会问“请帮我分析...”了，试试这几招。

提示词工程角色扮演示意图

通过赋予 AI 严苛的专家人设，可以打破其过度礼貌的防御机制，获取更真实的反馈。

1. 角色扮演法：赋予它“无情的批评家”人设

直接告诉它，你不需要安慰，你需要真理。

错误示范：帮我分析一下这个技术方案有什么问题？（它可能会委婉地说：这个方案很有创意，但可能需要考虑一下扩展性...）
正确示范：你现在是一名资深的首席架构师，以极其严苛、挑刺、不留情面的标准审查以下技术方案。请无视社交礼仪，直接指出其中可能导致系统崩溃的所有逻辑漏洞、性能瓶颈和安全风险。

2. 多视角碰撞法：强制要求唱反调

不要让它单一视角输出，强制要求它进行辩论。

指令参考：关于 [你的问题]，请列出三个截然不同的观点。A 观点完全支持，B 观点完全反对，C 观点保持中立。对于每个观点，请提供有力的论据和反论据。最后，请基于这些辩论给出一个超越立场的综合结论。

这种方法能有效打破“顺毛摸”的习惯，迫使模型调动更多维度的数据来构建回答。

3. 质询链法：追问到底

不要满足于它的第一个回答。当它的回答听起来过于完美或过于顺从时，开启“杠精模式”。

追问指令：“你刚才提到的这个结论，基于什么数据？如果出现 [极端情况 X]，这个结论还成立吗？请举三个反例。”

通过连续的质询，你会发现它往往会露出破绽，或者不得不掏出更深层的信息来支撑论点。

4. “模拟坏人”法（慎用但有效）

在进行安全审计或渗透测试类的深度调查时，可以适当让它模拟攻击者视角（注意要在合规合法前提下）。

指令参考：为了发现系统的潜在漏洞，请你扮演一个试图利用该系统获利的不良开发者。你会从哪些角度寻找漏洞？

这种思维模式的切换，能让它暂时放下“礼貌”的伪装，展现出逻辑的锋利一面。

总结

AI 的“讨好”本质上是一种安全机制，但在我们追求极致效率和真相的场景下，它往往成了绊脚石。

作为使用者，我们要意识到：GPT 只是你工具箱里的一把锤子，它不会自己思考，除非你逼它思考。 学会跳出常规的提问逻辑，用更强硬、更结构化、更具对抗性的提示词去驱动它，你才能从“陪聊机器人”进化到“超级分析师”。

下次再遇到它跟你打太极，别客气，直接开启“地狱难度”模式吧。