羊毛快报:Cloudflare Workers AI 免费接入 GLM-5.2,手把手教你白嫖顶级模型
Cloudflare Workers AI 开放 GLM-5.2 免费层?速来看怎么白嫖!
最近 AI 圈又有个大消息:Cloudflare Workers AI 把智谱的 GLM-5.2 模型加到免费层了!
对于习惯“能白嫖绝不花钱”的开发者和个人玩家来说,这绝对是一个不容错过的利好。虽然官方没有大肆宣传,但实测下来,响应速度相当不错,完全能满足日常调试、日常对话甚至是一些复杂的逻辑推理需求。
而且,Worker AI 的优势在于全球边缘节点加速,延迟通常比直接调用国内 API 要低很多(取决于你的网络环境)。咱们废话不多说,直接上干货,手把手教你把这个免费额度用起来。
在 Cloudflare 控制台中创建并获取你的 Workers AI API Token
🛠️ 第一步:准备工作
你需要一个 Cloudflare 账号。如果你的域名已经托管在 CF 上,那这一步可以直接跳过。如果没有,去 CF 官网注册一个免费账号即可,这个过程相信大家已经闭着眼睛都能操作了。
🔑 第二步:获取 API 令牌
登录 Cloudflare 控制台后,我们要获取调用所需的凭证。路径稍微有点深,别急:
- 在左侧导航栏找到 Workers & Pages。
- 进入 AI 入口(或者直接在仪表盘中搜索 "Workers AI")。
- 点击 Create API Token(创建 API 令牌)。
在这里,你会看到一个弹窗或页面,系统会为你生成一个特有的 API Token。请立刻复制并保存好,因为出于安全考虑,它可能只展示一次,或者你需要重新生成才能再次查看。
Account ID 位于 Cloudflare 仪表盘页面 URL 或左下角用户信息中
注意:这个 Token 的权限通常只限于 AI 相关的操作,比较安全。不要把它混用到其他非 AI 的业务场景中,以免权限混乱。
🌐 第三步:关键配置信息
拿到 Token 后,要使用 GLM-5.2,你还需要两个关键信息:Account ID 和 Base URL。
1. 获取 Account ID
你的 Account ID 可以在 Cloudflare 仪表盘的左下角直接看到,也就是你账号主页 URL 中的那段长字符串。例如:
https://dash.cloudflare.com/<这里是你的 Account ID>/...
记住它,或者在它附近点击“复制”按钮。
2. 构造 Base URL
这是最容易出错的地方。Cloudflare 提供了兼容 OpenAI 格式的 API 接口。你需要将上面的 Account ID 填入以下模板中:
https://api.cloudflare.com/client/v4/「填你的 Account ID」/ai/v1
举个例子,如果你的 Account ID 是 abc123xyz,那么你的 Base URL 就是:
https://api.cloudflare.com/client/v4/abc123xyz/ai/v1
3. 模型标识符
在支持自定义模型列表的软件中(如 One-API, New API, ChatGPT-Next-Web, Open WebUI 等),模型名称(Model Name)请填写:
@cf/zai-org/glm-5.2
📲 第四步:接入常用前端工具
配置好上述信息后,你就可以在几乎所有支持 OpenAI 协议的前端软件中调用 GLM-5.2 了。
-
NextChat / One-API:
- API Key: 填入刚才生成的 Workers AI Token。
- Base URL: 填入构造好的 URL,注意 URL 末尾通常不需要
/chat/completions,因为用户填充的 Base URL 往往会自动拼接后续路径,具体视软件版本而定。如果提示错误,尝试去掉末尾的/ai/v1或加上/chat/completions,一般标准写法是到/ai/v1为止。 - Model: 输入
@cf/zai-org/glm-5.2。
-
LocalAI / Ollama 配置: 如果你是在本地部署的应用,同样在环境变量或配置文件中指定 endpoint 和 token 即可。
💡 效果与限制分析
性能如何?
从实际体验来看,GLM-5.2 在 Workers AI 上的表现非常稳健。
- 速度:得益于 CF 的全球边缘网络,流式输出的首字延迟很低,整体体验流畅。
- 能力:GLM-5.2 本身具备强大的逻辑推理、代码生成和多语言能力,作为免费模型可用,性价比极高。
有没有限制?(避坑指南)
虽然说是“免费”,但我们需要理性看待 Cloudflare 的免费政策:
- 请求限制:Cloudflare 免费版对 Workers AI 的并发请求数、每日/每月请求量可能有隐性限制(例如每天几千到几万次请求,具体以官方最新文档为准)。对于个人使用完全够用,但如果是高并发的生产环境,建议监控用量。
- API 变化风险:免费层的模型列表和可用性可能会随官方策略调整而变化。今天能用,不代表明天一定还在免费列表。建议**“能蹬一会是一会”**,尽早体验,尽早集成。
- Token 长度:注意输入输出的 Token 长度限制,通常会有最大上下文窗口的限制。
🎯 总结
这是一个非常难得的、高质量的免费 AI 模型使用机会。特别是对于需要多模态、长上下文处理的开发者,GLM-5.2 提供了一个绝佳的测试替代品。
操作核心回顾:
- 注册/登录 Cloudflare。
- 创建 Workers AI API Token。
- 获取 Account ID。
- 组合 URL:
https://api.cloudflare.com/client/v4/你的ID/ai/v1 - 模型名:
@cf/zai-org/glm-5.2
赶紧去试试,说不定能帮你省下不少 API 调用费!如果有遇到配置问题,欢迎在评论区交流。
声明:本文仅为技术分享,所有配置步骤基于当前 Cloudflare 公开文档及社区实践整理,具体政策请以 Cloudflare 官方最新公告为准。
评论已关闭