Gemini 的“幻觉”为何也是一种高水平表现？

最近在使用各家大模型的时候，大家有没有发现一个有趣的现象？尤其是谷歌的 Gemini，有时候它一本正经地胡说八道，生成的内容离谱到让人哭笑不得。这种被我们称为“幻觉”（Hallucination）的表现，通常被视为 AI 的缺陷，是需要被修正和优化的方向。

AI generating fictional content

AI 'hallucination' illustrated as a creative process

但是，如果我们要换个角度想一想：这种极其逼真、甚至带有创造性的“幻觉”，是不是某种层面上 SoTA（State of the Art，最先进水平）的体现呢？

什么是 AI 的“幻觉”？

RAG technical diagram showing knowledge retrieval

How RAG works to reduce AI hallucinations

简单来说，大模型的“幻觉”就是指生成了看似合理、通顺，但实际上完全虚假、错误或不存在的信息。比如你问它某本书的剧情，它能编得天花乱坠，但这本书压根就不存在；或者让它写代码，它能生成毫无意义的函数名和逻辑，却看起来像那么回事。

在很多人的认知里，这是模型“不懂装懂”。但从技术的底层逻辑来看，大模型本质上是一个“文字接龙”的高手。它不是在数据库里检索答案，而是在根据概率预测下一个字应该是什么。

这就好比我们要评价一个作家的想象力。如果一个作家只能写完全写实、基于既有事实的流水账，那他只是一个“记录员”。但如果他能凭空构建一个完整的世界观，哪怕这个世界是虚构的，我们也会惊叹于他的创造力。

Gemini 有时候表现出的“幻觉”，其实说明了它具备了极强的语言组织能力和逻辑构建能力。它能够将毫不相关的概念串联起来，形成一个符合语法结构、甚至富有逻辑的故事。这说明模型已经掌握了语言的高级特性，只是缺乏对真实世界事实的约束。

甚至可以说，能够在“胡说八道”时依然保持逻辑自洽，某种程度上比单纯复读正确答案更考验模型的设计水平。这说明它的思维链已经非常复杂，只是我们在应用场景中更需要的是“准确性”，而不是“创造力”。

既然知道“幻觉”是底层机制带来的副作用，作为使用者，我们不妨调整一下心态和使用策略：

把它当做灵感生成器：如果你需要头脑风暴，或者写小说大纲，这种“一本正经的胡说八道”反而是极佳的素材来源。它不会局限于已有的知识库，能给你意想不到的脑洞。
RAG 是必选项：如果你需要处理严肃业务或生产环境代码，单纯依靠大模型是不够的。引入 RAG（检索增强生成）技术，给它挂载真实的知识库，强制它在特定范围内回答问题，这是目前解决“幻觉”最有效的方案之一。
交叉验证：对于关键信息，永远不要完全信任单一模型的输出。哪怕是 GPT-4 或者 Claude，在特定领域也可能出错。养成多问几个模型或查阅原始资料的习惯。

n Gemini 最近的“幻觉”表现，虽然在一定程度上影响了用户体验，但也侧面反映了当前大模型在语言生成和逻辑推理上的潜力。这就像是把一把锋利的双刃剑，既能切出绚丽的火花，也可能伤到自己。

技术的迭代从来不是一蹴而就的。也许在未来，我们不再需要消灭“幻觉”，而是学会如何控制它、引导它，让这种“想象力”在正确的场景下发光发热，成为真正的 SoTA 应用。

你觉得现阶段的大模型，是“准确”更重要，还是“聪明”更重要呢？欢迎在评论区聊聊你的看法。