最近在折腾一些技术问题,再次验证了一个让人哭笑不得的事实:Google 自家的 Gemini,在搜索这块儿,依然是典型的“扶不起”。

事情起因很简单,我遇到了一个关于 Google 自家工具 agy-cli 的使用问题。按理说,亲儿子问亲爹,这应该是秒回的难度吧?结果问 Gemini 的时候,它表现得特自信,答案写得有板有眼,逻辑严密,甚至还贴心地给出了代码示例。

但我拿着它给的指令去跑,全是报错。去翻官方文档一查,好家伙,参数名它都能给我编几个出来。这就是大模型最让人头疼的“幻觉”模式——一本正经地胡说八道。

Gemini 搜索结果截图

Gemini 在面对自家工具问题时的表现

为了对比,我又把同样的问题甩给了 Claude。

Claude 的反应就诚实得多。它先是坦白说这个工具它不太确定,然后主动使用了搜索功能去查最新的文档。几秒钟后,它给出的答案是基于真实文档的,跑一下就通了。

这事儿真的挺魔幻的

这就是所谓的“灯下黑”吗?

Google 拥有地球上最强大的搜索引擎,这是毫无疑问的。但为什么它家的 AI 模型,在整合搜索能力这件事上,反而落后于竞品?

从用户体感上来看,这种差异主要体现在两个维度:

  1. 搜索触发的主动性:Claude 在面对知识盲区时,似乎更倾向于“我要出去找找看”,而不是试图强行从训练数据里硬凑一个答案。这种“自知之明”对于技术问答来说太重要了。
  2. 信息的精准度:Gemini 的搜索经常给人一种“为了搜而搜”的感觉,有时候抓取的摘要和用户的实际问题南辕北辙。而 Claude 在检索后,往往能更好地结合上下文给出准确的引用。

给开发者的避坑建议

如果你也在用 AI 辅助写代码或者排查 Bug,尤其是涉及到具体工具、CLI 命令或者新框架时,千万别把 AI 的话当圣旨。

Gemini 搜索能力对比

Gemini 搜索能力依旧拉胯

  • 交叉验证:特别是当 AI 给出了具体的参数、版本号或者复杂命令时,务必去官方文档或者 Stack Overflow 确认一下。
  • 选对工具:在需要解决精确的技术问题时,目前看来,带有强搜索能力的模型(如 Claude 配合搜索)或者直接使用传统的搜索引擎 + AI 总结,可能比单纯依赖 Gemini 更靠谱。

总之,Google 啊,你啥时候能让 Gemini 真正学会怎么用自家的搜索?这波“反向带货”,属实是让人难绷。😅

标签: none

评论已关闭