我把软考成绩发给 DeepSeek，结果它的反应让我有点懵

最近，那个让无数打工人又爱又恨的“软考”终于出成绩了。大家查完成绩后的反应各不相同，有的狂喜，有的悲伤，还有的选择了一种最特别的方式来庆祝或者寻求安慰——把截图发给 AI。

这不，就有朋友把自己的成绩甩给了最近风头正劲的 DeepSeek，结果得到的回复却让他一脸问号。这事儿让我觉得特别有意思，今天咱们不聊技术参数，聊聊大家在使用国产大模型时遇到的这些“灵异时刻”。

当你把一张写着“综合知识 45、案例分析 50”的截图发给一个模型时，你期待的回复是什么？

然而，这位朋友的遭遇却是，DeepSeek 给出的回复莫名其妙。也许是看错了分数，也许是把它当成了某种代码片段，甚至开始分析起图片的排版布局来。这种“跨服聊天”的感觉，就像你跟厨师说菜太咸了，他却跟你聊起了盐的化学成份。

说到底，这其实揭示了目前大模型在多模态（尤其是图文结合）理解上的一些通病，或者说是一些“性格特点”。咱们不妨从技术角度稍微深挖一下，虽然咱是普通博主，但懂点原理能排雷。

OCR 与语义理解的断层 很多时候，模型先把图转成文字（OCR），然后再去理解语义。如果 OCR 识别出的格式很乱，或者夹杂着很多无关的噪点（比如网页底部的版权信息、花哨的边框文字），模型很容易就被带偏了。它可能以为自己看到了一张发票，或者一段代码，而不是一张成绩单。
上下文缺失的“幻觉” DeepSeek 作为以推理能力著称的模型，有时候太“想”帮你分析点什么了。当你只给一张图，没有前言后语时，它会在巨大的可能性空间里“脑补”。它可能觉得：“这用户给我一串数字，肯定是要我计算什么复杂公式吧？”于是乎，一本正经地胡说八道就出现了。
训练数据的偏差 这点很有意思。国产模型虽然中文能力很强，但如果它的训练数据里，“软考成绩”这种特定领域的样本占比不高，或者主要分布在内网数据里，公网模型对它的理解就很浅。它可能认识这几个字，但不知道这几个字组合在一起对打工人意味着什么（比如证书补贴、落户积分等）。它不懂“软考”的含金量，自然就给不出情绪价值。

既然咱们平时也用这些工具来提效，遇到这种“迷之回复”时，别急着骂它弱。试试这几招，往往能治好它的“精神病”：

加上 Prompt 引导：不要只发图。在图前面或者后面加句话：“这是我参加软考的成绩单，帮我分析一下。”给个明确的指令，就像给导航设定终点一样，别让它瞎猜。
关键信息打码或提取：如果图片周围干扰信息太多，比如有广告弹窗或者杂乱的背景，最好手动把关键数字扣出来，用文字形式发给它，准确率会直接飙升。
多轮对话“调教”：如果第一遍回答不对，就回它一句：“不对，这不是发票，这是考试分数，请重新评价。”模型通常具备很强的纠错能力，多说一句，它就知道之前的路走歪了。

DeepSeek 这次“翻车”其实挺可爱的，它提醒我们：现在的 AI 还不是全知全能的读心术大师，它更像是一个博学但偶尔会误解你意思的学霸朋友。

特别是对于像软考成绩这种带有强烈社会属性和情绪价值的信息，单纯的数据录入是不够的，还需要结合特定的语境理解。未来，国产大模型在这些垂直领域的微调肯定还有很长的路要走。

最后，不管 AI 认不认识你的成绩单，只要你自己心里过得去，那就是好成绩。要是还没查分的，祝大家锦鲤附体，要是查过了，不管过没过，都该喝奶茶喝奶茶！