Cloudflare Workers AI 开放 GLM-5.2 免费层?速来看怎么白嫖!

最近 AI 圈又有个大消息:Cloudflare Workers AI 把智谱的 GLM-5.2 模型加到免费层了!

对于习惯“能白嫖绝不花钱”的开发者和个人玩家来说,这绝对是一个不容错过的利好。虽然官方没有大肆宣传,但实测下来,响应速度相当不错,完全能满足日常调试、日常对话甚至是一些复杂的逻辑推理需求。

而且,Worker AI 的优势在于全球边缘节点加速,延迟通常比直接调用国内 API 要低很多(取决于你的网络环境)。咱们废话不多说,直接上干货,手把手教你把这个免费额度用起来。

Cloudflare 控制台创建 Workers AI API Token 的界面截图

在 Cloudflare 控制台中创建并获取你的 Workers AI API Token

🛠️ 第一步:准备工作

你需要一个 Cloudflare 账号。如果你的域名已经托管在 CF 上,那这一步可以直接跳过。如果没有,去 CF 官网注册一个免费账号即可,这个过程相信大家已经闭着眼睛都能操作了。

🔑 第二步:获取 API 令牌

登录 Cloudflare 控制台后,我们要获取调用所需的凭证。路径稍微有点深,别急:

  1. 在左侧导航栏找到 Workers & Pages
  2. 进入 AI 入口(或者直接在仪表盘中搜索 "Workers AI")。
  3. 点击 Create API Token(创建 API 令牌)。

在这里,你会看到一个弹窗或页面,系统会为你生成一个特有的 API Token。请立刻复制并保存好,因为出于安全考虑,它可能只展示一次,或者你需要重新生成才能再次查看。

Cloudflare 仪表盘左下角 Account ID 位置示意图

Account ID 位于 Cloudflare 仪表盘页面 URL 或左下角用户信息中

注意:这个 Token 的权限通常只限于 AI 相关的操作,比较安全。不要把它混用到其他非 AI 的业务场景中,以免权限混乱。

🌐 第三步:关键配置信息

拿到 Token 后,要使用 GLM-5.2,你还需要两个关键信息:Account IDBase URL

1. 获取 Account ID

你的 Account ID 可以在 Cloudflare 仪表盘的左下角直接看到,也就是你账号主页 URL 中的那段长字符串。例如: https://dash.cloudflare.com/<这里是你的 Account ID>/...

记住它,或者在它附近点击“复制”按钮。

2. 构造 Base URL

这是最容易出错的地方。Cloudflare 提供了兼容 OpenAI 格式的 API 接口。你需要将上面的 Account ID 填入以下模板中:

https://api.cloudflare.com/client/v4/「填你的 Account ID」/ai/v1

举个例子,如果你的 Account ID 是 abc123xyz,那么你的 Base URL 就是: https://api.cloudflare.com/client/v4/abc123xyz/ai/v1

3. 模型标识符

在支持自定义模型列表的软件中(如 One-API, New API, ChatGPT-Next-Web, Open WebUI 等),模型名称(Model Name)请填写:

@cf/zai-org/glm-5.2

📲 第四步:接入常用前端工具

配置好上述信息后,你就可以在几乎所有支持 OpenAI 协议的前端软件中调用 GLM-5.2 了。

  • NextChat / One-API

    • API Key: 填入刚才生成的 Workers AI Token。
    • Base URL: 填入构造好的 URL,注意 URL 末尾通常不需要 /chat/completions,因为用户填充的 Base URL 往往会自动拼接后续路径,具体视软件版本而定。如果提示错误,尝试去掉末尾的 /ai/v1 或加上 /chat/completions,一般标准写法是到 /ai/v1 为止。
    • Model: 输入 @cf/zai-org/glm-5.2
  • LocalAI / Ollama 配置: 如果你是在本地部署的应用,同样在环境变量或配置文件中指定 endpoint 和 token 即可。

💡 效果与限制分析

性能如何?

从实际体验来看,GLM-5.2 在 Workers AI 上的表现非常稳健。

  • 速度:得益于 CF 的全球边缘网络,流式输出的首字延迟很低,整体体验流畅。
  • 能力:GLM-5.2 本身具备强大的逻辑推理、代码生成和多语言能力,作为免费模型可用,性价比极高。

有没有限制?(避坑指南)

虽然说是“免费”,但我们需要理性看待 Cloudflare 的免费政策:

  1. 请求限制:Cloudflare 免费版对 Workers AI 的并发请求数、每日/每月请求量可能有隐性限制(例如每天几千到几万次请求,具体以官方最新文档为准)。对于个人使用完全够用,但如果是高并发的生产环境,建议监控用量。
  2. API 变化风险:免费层的模型列表和可用性可能会随官方策略调整而变化。今天能用,不代表明天一定还在免费列表。建议**“能蹬一会是一会”**,尽早体验,尽早集成。
  3. Token 长度:注意输入输出的 Token 长度限制,通常会有最大上下文窗口的限制。

🎯 总结

这是一个非常难得的、高质量的免费 AI 模型使用机会。特别是对于需要多模态、长上下文处理的开发者,GLM-5.2 提供了一个绝佳的测试替代品。

操作核心回顾:

  1. 注册/登录 Cloudflare。
  2. 创建 Workers AI API Token。
  3. 获取 Account ID。
  4. 组合 URL:https://api.cloudflare.com/client/v4/你的ID/ai/v1
  5. 模型名:@cf/zai-org/glm-5.2

赶紧去试试,说不定能帮你省下不少 API 调用费!如果有遇到配置问题,欢迎在评论区交流。


声明:本文仅为技术分享,所有配置步骤基于当前 Cloudflare 公开文档及社区实践整理,具体政策请以 Cloudflare 官方最新公告为准。

标签: none

评论已关闭