最近在 AI 辅助干活的时候,我无意中发现了一个挺有意思的现象:同样的问题,抛给 GPT 和 Claude,得到的反馈不仅仅是“正确答案”不同,连“性格”都好像变了。

以前大家总觉得 AI 就是冷冰冰的工具,尤其是 GPT 在迭代到 4o 乃至所谓的“5 时代”后,很多人觉得它变得越来越像一台精密的计算机,恨不得每句话都直奔主题,省去所有寒暄。但最近我有种强烈的错觉 —— GPT 好像变“感性”了?或者说,它的风格在不同的版本迭代里出现了明显的分化。

1. 理性派 vs 感性派:两极分化的体验

Claude 输出示例

Claude 回答示例,风格严谨

我在同一个项目里,用几乎相同的提示词对这两个模型进行了持续提问。除了针对它们反馈的小细节做了一点微调,整体的语境是完全没变的。

GPT 输出示例

GPT 回答示例,风格感性

Claude 的表现: 感觉越来越“硬核”了。记得大概是从 Opus 4.6 某个节点开始(具体版本号记不太清了,但体感很明显),它的回答变得越来越学术化和技术化。有时候它会抛出一些连我都要反复咀嚼才能看懂的术语,逻辑极其严密,甚至带点批判性的“负面”色彩。这种感觉非常理性,确实适合做那种需要极度严谨的技术审查或者代码 Debug,但如果你只是想找个虚拟朋友聊聊天,或者进行头脑风暴,它那种扑面而来的“工具感”真的会让你有点劝退。

GPT 的表现: 反观最近用的 GPT(比如 5.5 这个版本),画风突变。它似乎更懂得“读空气”,在讨论文学创作或者需要情感共鸣的话题时,优势非常大。回答不再像填空题一样死板,而是带有一种引导性,甚至会照顾到用户的情绪。对于我这种平时需要搞搞文字创作、喜欢感性一点的人来说,这种真的太对味了。

2. 为什么会出现这种风格差异?

其实仔细想想,这背后可能是厂商对模型定位的调整。

  • Claude 可能更侧重于“安全”和“精准”。为了减少幻觉和保证输出的绝对准确,RLHF(人类反馈强化学习)的权重可能更偏向于那些看起来更专业、更书面化的表达。这就导致它有时候显得有点不近人情,像个只会说教的老教授。
  • GPT 则在保留强大逻辑的同时,似乎在“拟人化”上下足了功夫。特别是对于长文本的理解和生成,它更擅长捕捉语境中的情感流动,这让它更适合做 Co-pilot(副驾驶)而不是单纯的 Calculator(计算器)。

3. 场景决定选型:别让AI性格耽误你的效率

作为普通用户,我们不用去深究背后的 Transformer 架构到底怎么调的,只要知道怎么“用对人”就行。根据我的实际体验,给大家一点小建议:

  • 场景 A:文学创作、头脑风暴、情感咨询、写大纲。 👉 首选 GPT。 它的共情能力更强,能接住你的梗,也能给你提供更有温度的建议。当你卡文的时候,它那种“软一点”的引导往往能给你灵感。

  • 场景 B:代码审查、技术文档翻译、极其复杂的数据分析、学术论文纠错。 👉 首选 Claude。 它的犀利和严谨能帮你发现那些被忽略的逻辑漏洞。在这个场景下,GPT 的“圆滑”有时候反而会掩盖错误的本质。

  • 场景 C:日常琐碎的问答。 👉 看心情。 如果你想被赞美一下,找 GPT;如果你想被喷醒,找 Claude。哈哈,开个玩笑,但其实两者质量都很高,区别更多在于语气。

总结

AI 的进化速度太快了,以前我们只追求“准不准”,现在我们开始讲究“对不对味”。GPT 变得更加感性、体贴,或许正是为了适应我们在非技术领域的使用需求。

不知道大家在日常使用中有没有类似的感受?你们更喜欢哪个模型的“口癖”?欢迎在评论区分享你的奇葩对话经历!

标签: none

评论已关闭