最近用 AI 助手的时候,大家有没有一种感觉:明明一句能说清的事儿,它非要给你扯一堆套话?问个“你好”,它能回你一段小作文;要个代码片段,它能先跟你讲半天历史背景。这种“废话文学”级别的输出风格,到底是怎么被训练出来的?今天咱们就从技术角度扒一扒这背后的原因。

很多人觉得 AI 啰唆是因为它“太聪明了”,生怕你听不懂。确实,这算是一部分原因,但更深层次的逻辑其实藏在训练数据和方法里。

AI assistant displaying a long and verbose response on a screen

AI助手生成冗长回答的示意图

预训练阶段的“平均数”陷阱

首先,在大模型的预训练阶段,它可是读了互联网上几乎所有的文本数据。大家可以想象一下,互联网上高质量、言简意赅的问答多,还是那种长篇大论的解释多?很不幸,后者居多。

模型在学习预测下一个字的时候,本质上是基于概率的。当它面对一个问题时,如果在海量数据中,大多数回答都倾向于“铺垫+解释+总结”的结构,模型就会自然而然地认为这种冗长的输出是“正确”的。它在模仿人类的平均表达习惯,而人类的平均习惯往往就是有点啰唆。

SFT(监督微调):榜样的力量

预训练完只是个半成品,真正的性格定型往往发生在 SFT 阶段。这时候,模型会学习大量的人工标注数据。

问题的关键来了:标注员是谁?标注标准是什么?通常,为了让 AI 看起来“聪明”和“有帮助”,标注员往往倾向于给那些解释详细、条理清晰的回答打高分。如果回答太简短,可能会被认为“信息量不足”或“态度敷衍”。

流程图展示AI训练中的数据标注过程

监督微调(SFT)阶段的标注流程示意图

久而久之,模型就学到了一个潜规则:写得多 = 分数高 = 好回答。这就直接导致后续生成内容时,就算不需要,它也会习惯性地加上“首先、其次、最后”这种三段式结构,生怕自己表现得不专业。

RLHF(基于人类反馈的强化学习):安全的副作用

到了 RLHF 阶段,人类评估员会对模型的回答进行排序。这个阶段的一个核心目标是“安全”和“有帮助”。

为了确保“安全”,模型倾向于把话说圆满。有时候,简短的回答可能会因为歧义而被判定为有风险。为了避免踩雷,模型学会了通过增加限定词、解释词来稀释可能的误解。这是一种防御性输出策略——说得越多,逻辑上越严丝合缝,被判定为“错误”或“有害”的概率就越低。

此外,在“有帮助”这个指标上,冗长的信息似乎天然比简短的回答看起来更有分量。这就导致模型在优化过程中,越来越倾向于生成“注水”的内容。

我们能怎么办?

当然啰唆也不全是坏事,对于教育场景或者需要手把手的教程来说,这种风格反而很友好。但对于资深用户来说,确实是种折磨。

如果你想要简练的回答,唯一的办法就是在 Prompt 里下死命令。比如明确要求:“用不超过 50 个字回答”、“不要废话,只要结果”或者“格式要求:无序号列表”。模型虽然在训练上偏爱啰唆,但在指令遵循上还是听劝的。

总结

AI 的啰唆并不是它故意气你,而是数据分布、标注偏好和安全机制共同作用的产物。它被训练成了一个“过度解释”和“追求安全”的优等生。要想让它闭嘴,咱们还得学会更精准地“调教”这只生成概率的怪兽。

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭