Google 亲儿子也拉胯？为什么 Gemini 连自家的文档都搜不明白

最近在折腾一些技术问题，再次验证了一个让人哭笑不得的事实：Google 自家的 Gemini，在搜索这块儿，依然是典型的“扶不起”。

事情起因很简单，我遇到了一个关于 Google 自家工具 agy-cli 的使用问题。按理说，亲儿子问亲爹，这应该是秒回的难度吧？结果问 Gemini 的时候，它表现得特自信，答案写得有板有眼，逻辑严密，甚至还贴心地给出了代码示例。

但我拿着它给的指令去跑，全是报错。去翻官方文档一查，好家伙，参数名它都能给我编几个出来。这就是大模型最让人头疼的“幻觉”模式——一本正经地胡说八道。

Gemini 搜索结果截图

Gemini 在面对自家工具问题时的表现

为了对比，我又把同样的问题甩给了 Claude。

Claude 的反应就诚实得多。它先是坦白说这个工具它不太确定，然后主动使用了搜索功能去查最新的文档。几秒钟后，它给出的答案是基于真实文档的，跑一下就通了。

这就是所谓的“灯下黑”吗？

Google 拥有地球上最强大的搜索引擎，这是毫无疑问的。但为什么它家的 AI 模型，在整合搜索能力这件事上，反而落后于竞品？

从用户体感上来看，这种差异主要体现在两个维度：

搜索触发的主动性：Claude 在面对知识盲区时，似乎更倾向于“我要出去找找看”，而不是试图强行从训练数据里硬凑一个答案。这种“自知之明”对于技术问答来说太重要了。
信息的精准度：Gemini 的搜索经常给人一种“为了搜而搜”的感觉，有时候抓取的摘要和用户的实际问题南辕北辙。而 Claude 在检索后，往往能更好地结合上下文给出准确的引用。

如果你也在用 AI 辅助写代码或者排查 Bug，尤其是涉及到具体工具、CLI 命令或者新框架时，千万别把 AI 的话当圣旨。

Gemini 搜索能力对比

Gemini 搜索能力依旧拉胯

交叉验证：特别是当 AI 给出了具体的参数、版本号或者复杂命令时，务必去官方文档或者 Stack Overflow 确认一下。
选对工具：在需要解决精确的技术问题时，目前看来，带有强搜索能力的模型（如 Claude 配合搜索）或者直接使用传统的搜索引擎 + AI 总结，可能比单纯依赖 Gemini 更靠谱。

总之，Google 啊，你啥时候能让 Gemini 真正学会怎么用自家的搜索？这波“反向带货”，属实是让人难绷。😅