最近,AI 爬虫肆虐的问题让不少站长和博主头疼不已。辛辛苦苦写的内容,被人家拿去训练大模型,甚至连带流量都被截胡,自己却很难分到一杯羹。不过,作为互联网基础设施的大佬 Cloudflare 终于看不下去了,直接甩出了一套「组合拳」,打算帮大家把自家的围栏扎得更紧一点。

speech_balloon

Cloudflare 细化网络爬虫屏蔽管理,将默认禁止 AI 代理与训练爬虫访问广告页面 前沿快讯 - 人工智能 , - 转载 post by c519127 3

1. 以前的爬虫是「流氓」,现在的爬虫会「伪装」

source-image

Linux.do 用户头像

以前我们防爬虫,看 User-Agent,对上了就放,对不上就拦。但现在的 AI 厂商学精了,很多爬虫是「混合型」的:它既说是搜索引擎的爬虫(为了收录),背地里却在干数据训练的活儿。

这就导致站长很尴尬:你想让它收录以便用户搜到,但不想让它拿去训练赚钱。Cloudflare 这次的新逻辑就是按行为打标签。不管你自称是什么,只要检测到你在这个网页上有「训练」或「代理」的行为,那就给你贴上对应标签。而且,Cloudflare 的新爬虫管理器有个很绝的设定:一只爬虫只要触犯了其中一条禁忌(比如被标记为训练爬虫),那么它在整个网站的访问权限都会被封杀。 哪怕你本来也是搜索引擎爬虫,只要干了坏事,连坐处理。

2. 广告页面的「绝对保护区」

这可能是这次更新中最硬核的一点。Cloudflare 明确表示,计划在 2026 年 9 月 15 日默认禁止 AI 代理与训练爬虫访问含广告的网页。

为什么是广告页面?因为这直接关系到站长的饭碗。大多数站长其实并不介意 AI 发现自己的内容,前提是不能影响收益。如果 AI 爬虫大量抓取带广告的页面却不展示广告,或者把内容直接提炼成答案给用户,导致用户根本不点进官网,那站长的广告费谁给补?

这个默认禁令意味着,除非站长主动去改设置,否则 AI 想要白嫖带商业价值的内容,门都没有。

3. 从 SEO 到 AEO,流量逻辑变了

n Cloudflare 还敏锐地捕捉到了搜索生态的变化。大家都知道 SEO(搜索引擎优化),但现在风向变了,进入了 AEO(Answer Engine Optimization,答案引擎优化)时代。现在的用户更倾向于直接问 AI 要答案,而不是去搜一堆链接列表。

为了适应这点,Cloudflare 推出了新版的归因业务洞察仪表板。这东西能帮你分析流量来源和结构,让你清楚地知道你的内容是怎么被 AI「引用」和「消耗」的。虽然现在还没完全实现付费,但这为未来可能的「抓取付费」模式打下了基础。

4. 站长的新武器:省流量、能变现

除了防 AI,这次更新还有两个实打实的技术利好:

  • 页面变动监控:避免 AI 爬虫像无头苍蝇一样频繁抓取没变化的页面,浪费你的带宽和服务器资源。只有内容变了才让来抓,这就很人性化。
  • 按使用计价的抓取付费模式:这个算是画了个大饼,但方向很明确。如果未来的 AI 厂商想高质量抓取你的数据,可能得按次付费。对于高质量内容创作者来说,这绝对是潜在的变现渠道。

总结:这是好事,但还得等两年

Cloudflare 这一波操作,算是站在了站长这边,尤其是 2026 年那个「默认屏蔽」的承诺,虽然时间线拉得有点长(毕竟是两年后),但也给行业定了个调:互联网内容不是公有财产,想用数据训练模型?得先问问同不同意。

对于咱们普通博主来说,接下来能做的就是多关注 Cloudflare 后台的各种新按钮,把该关的入口关上,静待流量战争的新变化。

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭