Sub2API 接入国产大模型实战指南:Kimi、通义千问无缝对接教程
以前用 Sub2API 的时候,大家可能更多是盯着 OpenAI 的 GPT 系列,毕竟那是“原教旨主义”的标准答案。但随着 Kimi、通义千问(Qwen)、智谱等国产大模型的飞速迭代,很多人开始问:Sub2API 能不能接这些国产模型?怎么接才能保证稳定不掉链子?
答案显然是肯定的。Sub2API 的设计初衷就是聚合多个源,而现在的国产模型大多提供了兼容 OpenAI 格式的 API 接口,这使得接入变得异常简单。今天就把这个操作过程拆解开来,手把手教你把 Kimi 2.0 或通义千问接入你的 Sub2API 面板。
一、 核心逻辑:为什么能接?
Sub2API 支持的模型列表并不是写死在代码里的“封闭花园”,它更像是一个路由器。只要目标模型提供的 API 协议是 OpenAI Compatible(即遵循 /v1/chat/completions 等标准路由),并且参数结构相似,Sub2API 就能转发请求。
目前主流的国产模型平台,如月之暗面(Kimi)、阿里云(通义千问)、智谱 AI(glm-4)等,均原生支持 OpenAI 协议。这意味着,你不需要修改 Sub2API 的源码,只需正确配置上游地址和密钥即可。
二、 实操步骤:以 Kimi 和 通义千问为例
1. 获取 API Key
首先你需要去对应的大模型开放平台注册并生成 API Key。
- Kimi (月之暗面):登录 open.ms 控制台,在“API Keys”菜单下创建新 Key,记住格式通常是
sk-xxxxx。 - 通义千问 (阿里):登录阿里云百炼平台, Dashboard -> API-KEY 管理,复制生成的 Key。
2. 修改 Sub2API 配置
打开你的 Sub2API 配置文件(通常是 config.yaml 或在 Web 管理后台的“节点配置”/“上游设置”中)。
你需要添加一个新的上游节点(Upstream)或直接在模型映射中进行绑定。
- Name/Label: 你可以随意命名,比如
Kimi-Moonshot或Qwen-Max。 - API Key: 填入你刚才复制的 Key。
- Base URL: 这是最关键的一步,不同厂商地址不同:
- Kimi:
https://api.moonshot.cn/v1 - 通义千问:
https://dashscope.aliyuncs.com/compatible-mode/v1 - 智谱 GLM:
https://open.bigmodel.cn/api/paas/v4
- Kimi:
- Models: 这里需要填写该 API Key 对应的具体模型名称。注意: 这里填的名称必须与上游平台完全一致,且建议在该字段后加个备注方便区分。
- Kimi 推荐填入:
moonshot-v1-8k,moonshot-v1-32k,moonshot-v1-128k - 通义千问推荐填入:
qwen-max,qwen-plus,qwen-turbo
- Kimi 推荐填入:
3. 客户端映射(可选但推荐)
在 Sub2API 内部,你可能希望将发送来的 gpt-4 或 claude-3.5 请求重定向到这些国产模型,以节省成本或测试效果。你可以在“模型重定向”或“自定义模型”列表中设置:
- 映射规则:
input: gpt-4o-mobile -> output: moonshot-v1-8k - 这样,当客户端调用
gpt-4o-mobile时,Sub2API 会实际请求 Kimi 的接口。
三、 避坑指南与常见问题
Q1: 提示 Model Not Found 或 Invalid API Key?
- 检查 Model Name: 很多时候是你填的模型名和官方文档不一致。比如通义千问有时用
qwen-max,有时旧接口用qwen-max-120119,务必查阅最新 API 文档。Kimi 的模型名没有版本后缀,直接填moonshot-v1-8k即可。 - 检查 Base URL: 确保最后带有
/v1,地址是否正确包含https://。
Q2: Kimi 的长文本支持怎么设置?
- Sub2API 默认可能不传递
max_tokens或temperature等高级参数到所有上游。如果需要在 Sub2API 客户端指定长上下文,确保你在请求时显式传入了model参数,并且该参数在 Sub2API 的白名单或映射表中存在。Kimi 的moonshot-v1-128k支持超长上下文,适合做文档总结。
Q3: 并发被限流怎么办?
- 国产大模型对并发(RPM/TPM)限制比 OpenAI 更严格。建议在 Sub2API 中为这些节点设置合理的 限流策略 或 心跳测试,避免瞬间大流量打挂 Key。可以在管理后台为每个上游节点设置独立的速率限制(如 10 req/min)。
Q4: 结构化输出(JSON Mode)支持吗?
- Kimi 和 通义千问均支持
response_format: {"type": "json_object"}。如果在 Sub2API 中调用时出现格式错误,请检查请求参数是否正确透传。通常 Sub2API 会原样转发此参数,但如果上游拒绝,会返回400 Bad Request,此时需检查 Prompt 是否明确要求了 JSON 格式。
四、 进阶技巧:成本优化
接入国产模型最大的优势在于成本。例如 qwen-turbo 的价格远低于 GPT-4,而 qwen-max 在逻辑推理上已接近 GPT-4 Turbo 水平。你可以这样做:
- 分流策略:在 Sub2API 中配置权重,将简单的闲聊任务路由到便宜的
qwen-turbo或moonshot-v1-8k,将复杂的代码生成路由到gpt-4或glm-4-plus。 - 缓存复用:开启 Sub2API 的缓存功能(如果支持),对于相同的 Prompt 快速返回结果,进一步降低 Token 消耗。
总结
接入 Kimi、通义千问等国产模型到 Sub2API 并不复杂,关键在于精准的 Base URL 和正确的模型名称映射。一旦配置成功,你不仅能享受更低的资费,还能利用国产模型在中文语境下的出色表现。赶紧去你的控制台试试吧,记得先小流量测试,确保稳定性后再全量切换!
评论已关闭