AI 这几个月的发展速度简直让人眼花缭乱,很多朋友都在问:现在的智能体到底能不能真正干活?能不能取代程序员、设计师或者文案?

以前我们看评测,大都是些学术基准或者做题比赛,离真实赚钱的业务场景有点远。但最近一个名为 Remote Labor Index (RLI) 的基准测试给了一个非常残酷但也非常真实的答案。

Fable 5 表现数据图表

Fable 5 在 RLI 自由职业基准中自动化率达到 16.1%,8 个月提升 6 倍

什么是 RLI 基准?

简单来说,RLI 不玩虚的。它直接拿市场上真金白银的付费自由职业项目来考 AI。这次测试涵盖了 240 个总价值高达 14.4 万美元的真实任务。这就好比直接让 AI 去接 Upwork 或者猪八戒网的单子,客户验收合格才算数。这才是检验 AI “打工”能力的试金石。

Fable 5 的恐怖表现

Fable 5 与其他模型基准测试对比图

Fable 5 与其他知名模型在自动化率上的表现对比

在这场“实战演练”中,名为 Fable 5 的模型表现堪称炸裂。数据显示,它的自动化率达到了 16.1%

这是什么概念?这意味着在所有测试的真实项目中,有超过六分之一的项目,AI 可以直接全流程搞定,达到客户认可的专业质量,而无需人类介入。

更夸张的是它的增长速度。仅仅 8 个月时间,这个指标就提升了 6 倍。大家品品这个斜率,这几乎是指数级的进化。相比之下,其他知名模型的表现如下(数据仅供参考,具体型号随时间迭代):

  • Opus 4.8: 8.3%
  • GPT-5.5: 6.3%

可以看出,Fable 5 并不是微弱领先,而是实现了断层式碾压。

从“噱头”到“劳动力替代”

虽然 16.1% 听起来还不是绝大多数,还有 80% 多的项目 AI 搞不定,但这个数据的含金量在于**“真实付费”“6 倍增速”**。

  1. 可用边界正在外推:以前 AI 只能写写代码片段或者画个草图,现在它已经能完成端到端的项目交付了。虽然目前主要集中在特定类型的任务上,但这说明技术瓶颈正在被一个个打破。

  2. 商业价值凸显:对于企业主来说,如果你的项目恰好在那 16.1% 的范围内,用 AI 的成本将远低于雇佣人类自由职业者。这对于自由职业市场来说,是一个明确的警示信号。

  3. 技术迭代的必然性:8 个月提升 6 倍,按照这个进化速度,明年的今天,自动化率突破 50% 并不是天方夜谭。

自由职业者该怎么办?

很多靠接单为生的朋友可能会感到焦虑。其实大可不必惊慌,AI 目前虽然进步神速,但在处理复杂沟通、需求变更以及需要极高创意和情感理解的任务上,依然不如人类。

但这确实给我们提了个醒:纯执行类、标准化程度高的外包项目,正在快速失去竞争壁垒。

与其担心被替代,不如思考如何利用这些工具成为“超级个体”。让 AI 帮你完成那些繁琐的基础工作,你负责把控质量、创意和客户关系,这才是未来的生存之道。

总之,Fable 5 的这次突破再次证明,“AI 接单”已经不再是PPT里的概念,而是正在发生的现实。拥抱变化,可能比焦虑更重要。

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭