Fable 5 竟然认出《再见绘梨》，AI 视觉理解的新高度来了？

最近圈子里有个让人“瞳孔地震”的消息，那就是 Fable 5 模型的表现，简直强得有点离谱。

事情是这样的，有位博主随手把一部不算大众的漫画扔给了 Fable 5。结果这玩意儿不仅认出来了，还能准确地讲出漫画的具体页数，甚至对剧情细节了如指掌。要知道，连博主自己都还没仔细看过这部作品，这感觉就像是你随手拍了一张照片，结果有人不仅认出了这是哪条街，还告诉你路口那家店十年前卖的是什么早餐。

大家平时接触的 AI，大多还是停留在“看图说话”的阶段。你给它一张猫的照片，它说“这是一只猫”；给一张风景照，它描述“蓝天白云”。这种能力虽然已经不错，但在面对复杂的视觉信息时，往往还是有些“人工智障”。

但是，Fable 5 这次展示的能力，已经不仅仅是“看”了，更像是“读”和“理解”。漫画这种媒介，其实比照片难搞多了。它有分镜、有对话框、有背景细节，还有独特的画风。尤其是像《再见绘梨》这类作品，画面信息密度极高，普通的 OCR 或图像识别模型根本无从下手。

Fable 5 不仅能识别图像，还能把这些碎片化的视觉信息整合成连贯的语义逻辑。这就意味着，它不再是一个单纯的像素扫描仪，而是一个真正具备了“视觉阅读能力”的大脑。

这其实是整个 AI 行业技术风向转变的一个缩影。以前的模型可能更注重文本生成或单一维度的理解，现在的竞争核心已经变成了“全知全能”的感知能力。

AI视觉理解漫画示例

AI视觉理解漫画示例

Fable 5 这种级别的表现，说明背后的训练数据量和模型架构设计已经达到了一个新的量级。它不仅仅是在学习图像特征，更是在学习图像背后的世界知识。这种跨越式的进步，对于那些需要处理大量图文资料的用户来说，绝对是个重磅利好。

可能有人会说，认得漫画页数有啥用？能帮我赚钱吗？

还真可能。

当然，技术越强，大家对这个领域的期待值也就拉得越高。Fable 5 这次的小试牛刀，可能会成为接下来这一波 AI 视觉模型混战的“定海神针”。咱们普通用户就坐等好戏上演，看看这些大厂还能给我们整出什么意想不到的活儿来。

AI内容审核技术示意图

AI内容审核技术示意图