Cloudflare Workers AI 开放 GLM-5.2 免费层？速来看怎么白嫖！

最近 AI 圈又有个大消息：Cloudflare Workers AI 把智谱的 GLM-5.2 模型加到免费层了！

对于习惯“能白嫖绝不花钱”的开发者和个人玩家来说，这绝对是一个不容错过的利好。虽然官方没有大肆宣传，但实测下来，响应速度相当不错，完全能满足日常调试、日常对话甚至是一些复杂的逻辑推理需求。

而且，Worker AI 的优势在于全球边缘节点加速，延迟通常比直接调用国内 API 要低很多（取决于你的网络环境）。咱们废话不多说，直接上干货，手把手教你把这个免费额度用起来。

Cloudflare 控制台创建 Workers AI API Token 的界面截图

在 Cloudflare 控制台中创建并获取你的 Workers AI API Token

🛠️ 第一步：准备工作

你需要一个 Cloudflare 账号。如果你的域名已经托管在 CF 上，那这一步可以直接跳过。如果没有，去 CF 官网注册一个免费账号即可，这个过程相信大家已经闭着眼睛都能操作了。

🔑 第二步：获取 API 令牌

在左侧导航栏找到 Workers & Pages。
进入 AI 入口（或者直接在仪表盘中搜索 "Workers AI"）。
点击 Create API Token（创建 API 令牌）。

在这里，你会看到一个弹窗或页面，系统会为你生成一个特有的 API Token。请立刻复制并保存好，因为出于安全考虑，它可能只展示一次，或者你需要重新生成才能再次查看。

Cloudflare 仪表盘左下角 Account ID 位置示意图

Account ID 位于 Cloudflare 仪表盘页面 URL 或左下角用户信息中

注意：这个 Token 的权限通常只限于 AI 相关的操作，比较安全。不要把它混用到其他非 AI 的业务场景中，以免权限混乱。

🌐 第三步：关键配置信息

拿到 Token 后，要使用 GLM-5.2，你还需要两个关键信息：Account ID 和 Base URL。

1. 获取 Account ID

你的 Account ID 可以在 Cloudflare 仪表盘的左下角直接看到，也就是你账号主页 URL 中的那段长字符串。例如： https://dash.cloudflare.com/<这里是你的 Account ID>/...

记住它，或者在它附近点击“复制”按钮。

2. 构造 Base URL

这是最容易出错的地方。Cloudflare 提供了兼容 OpenAI 格式的 API 接口。你需要将上面的 Account ID 填入以下模板中：

https://api.cloudflare.com/client/v4/「填你的 Account ID」/ai/v1

举个例子，如果你的 Account ID 是 abc123xyz，那么你的 Base URL 就是： https://api.cloudflare.com/client/v4/abc123xyz/ai/v1

3. 模型标识符

在支持自定义模型列表的软件中（如 One-API, New API, ChatGPT-Next-Web, Open WebUI 等），模型名称（Model Name）请填写：

@cf/zai-org/glm-5.2

📲 第四步：接入常用前端工具

配置好上述信息后，你就可以在几乎所有支持 OpenAI 协议的前端软件中调用 GLM-5.2 了。

NextChat / One-API：
- API Key: 填入刚才生成的 Workers AI Token。
- Base URL: 填入构造好的 URL，注意 URL 末尾通常不需要 /chat/completions，因为用户填充的 Base URL 往往会自动拼接后续路径，具体视软件版本而定。如果提示错误，尝试去掉末尾的 /ai/v1 或加上 /chat/completions，一般标准写法是到 /ai/v1 为止。
- Model: 输入 @cf/zai-org/glm-5.2。
LocalAI / Ollama 配置：如果你是在本地部署的应用，同样在环境变量或配置文件中指定 endpoint 和 token 即可。

💡 效果与限制分析

性能如何？

从实际体验来看，GLM-5.2 在 Workers AI 上的表现非常稳健。

速度：得益于 CF 的全球边缘网络，流式输出的首字延迟很低，整体体验流畅。
能力：GLM-5.2 本身具备强大的逻辑推理、代码生成和多语言能力，作为免费模型可用，性价比极高。

有没有限制？（避坑指南）

虽然说是“免费”，但我们需要理性看待 Cloudflare 的免费政策：

请求限制：Cloudflare 免费版对 Workers AI 的并发请求数、每日/每月请求量可能有隐性限制（例如每天几千到几万次请求，具体以官方最新文档为准）。对于个人使用完全够用，但如果是高并发的生产环境，建议监控用量。
API 变化风险：免费层的模型列表和可用性可能会随官方策略调整而变化。今天能用，不代表明天一定还在免费列表。建议**“能蹬一会是一会”**，尽早体验，尽早集成。
Token 长度：注意输入输出的 Token 长度限制，通常会有最大上下文窗口的限制。

🎯 总结

这是一个非常难得的、高质量的免费 AI 模型使用机会。特别是对于需要多模态、长上下文处理的开发者，GLM-5.2 提供了一个绝佳的测试替代品。

操作核心回顾：

注册/登录 Cloudflare。
创建 Workers AI API Token。
获取 Account ID。
组合 URL：https://api.cloudflare.com/client/v4/你的ID/ai/v1
模型名：@cf/zai-org/glm-5.2

赶紧去试试，说不定能帮你省下不少 API 调用费！如果有遇到配置问题，欢迎在评论区交流。

声明：本文仅为技术分享，所有配置步骤基于当前 Cloudflare 公开文档及社区实践整理，具体政策请以 Cloudflare 官方最新公告为准。

羊毛快报：Cloudflare Workers AI 免费接入 GLM-5.2，手把手教你白嫖顶级模型