DeepSeek V4.1 来了？App 已悄悄上线识图功能，对比 V4 Pro 提升多大？

最近有不少朋友在群里问：DeepSeek 的 V4.1 到底啥时候正式发布？其实，如果你细心的话，打开现在的 DeepSeek App 可能会发现一些新东西。

没错，V4.1 的部分功能似乎已经“偷偷”上身了，特别是大家期待已久的识图能力。

根据不少用户的反馈，在 DeepSeek App 的最新版本中，上传图片后的处理逻辑有了明显变化。不再仅仅是简单的预览，而是能够进行图片内容的理解和交互。这意味着 V4.1 的多模态能力已经不仅仅停留在模型层面，而是已经接入了前端应用。

DeepSeek App 上传图片并进行交互的界面演示

DeepSeek App 新版界面中的识图功能演示，显示用户上传图片后与 AI 进行交互的场景。

对于经常需要截图提问、识别文档或者分析图表的朋友来说，这绝对是个生产力利器。不用再频繁切换到专门的 OCR 工具或者多模态大模型去中转，直接在对话流里搞定，体验会顺滑很多。

这是大家最关心的问题。毕竟 V4 Pro 之前的表现已经相当能打，甚至被不少人称为“性价比之王”。

参数层面的猜测： 虽然官方还没放出技术报告，但根据社区内的测试和经验推测，V4.1 并不一定是参数量的暴力堆砌，更多的是在“对齐”和“长文本”、“多模态融合”上的精修。

DeepSeek V4.1 与 V4 Pro 在逻辑推理、识图等方面的能力对比

DeepSeek V4.1 与 V4 Pro 在逻辑推理、长文本处理及多模态能力方面的预估对比图。

逻辑推理能力： 相比 V4 Pro，V4.1 在复杂逻辑推理上的错误率可能会有所降低，尤其是在长对话中，对上下文的遗忘情况应该会有改善。
识图与代码： 在代码层面的提升可能不明显（因为 V4 Pro 已经很强），但配合识图功能，通过“看图写代码”或者是“看 UI 图生成前端代码”的准确度会有肉眼可见的提升。

实际体验差距： 如果你是轻度用户，日常查资料、写周报，V4 Pro 和 V4.1 的体感差距可能不会特别巨大。但如果你是重度开发者，或者需要处理大量图文混合的复杂任务，V4.1 带来的效率提升可能会让你不想再回到旧版本。

通常大模型的更新节奏是“模型训练 -> 接口灰度 -> App 功能集成 -> 正式发布”。现在 App 里已经能看到识图功能的上线，这说明底层模型的 API 基本已经稳定。

不出意外的话，V4.1 的正式官宣时间点应该非常近了。对于开发者来说，API 的调用价格是否会调整？新版本是否会作为 V4 Pro 的免费升级？这些只有等官方一纸公告才能揭晓。

如果你现在急需使用识图功能，不妨直接更新 App 尝试一下“内测版”的味道。如果只是纯文本对话需求，V4 Pro 目前依然是非常稳的选择，不用急着焦虑。

不过，技术迭代永远不等人。对于喜欢“薅羊毛”和追求极致效率的博主来说，V4.1 的多模态能力一旦全面开放，肯定会催生出一波新的 AI 玩法和工作流，咱们拭目以待！