以前用 Sub2API 的时候,大家可能更多是盯着 OpenAI 的 GPT 系列,毕竟那是“原教旨主义”的标准答案。但随着 Kimi、通义千问(Qwen)、智谱等国产大模型的飞速迭代,很多人开始问:Sub2API 能不能接这些国产模型?怎么接才能保证稳定不掉链子?

答案显然是肯定的。Sub2API 的设计初衷就是聚合多个源,而现在的国产模型大多提供了兼容 OpenAI 格式的 API 接口,这使得接入变得异常简单。今天就把这个操作过程拆解开来,手把手教你把 Kimi 2.0 或通义千问接入你的 Sub2API 面板。

一、 核心逻辑:为什么能接?

Sub2API 支持的模型列表并不是写死在代码里的“封闭花园”,它更像是一个路由器。只要目标模型提供的 API 协议是 OpenAI Compatible(即遵循 /v1/chat/completions 等标准路由),并且参数结构相似,Sub2API 就能转发请求。

目前主流的国产模型平台,如月之暗面(Kimi)、阿里云(通义千问)、智谱 AI(glm-4)等,均原生支持 OpenAI 协议。这意味着,你不需要修改 Sub2API 的源码,只需正确配置上游地址和密钥即可。

二、 实操步骤:以 Kimi 和 通义千问为例

1. 获取 API Key

首先你需要去对应的大模型开放平台注册并生成 API Key。

  • Kimi (月之暗面):登录 open.ms 控制台,在“API Keys”菜单下创建新 Key,记住格式通常是 sk-xxxxx
  • 通义千问 (阿里):登录阿里云百炼平台, Dashboard -> API-KEY 管理,复制生成的 Key。

2. 修改 Sub2API 配置

打开你的 Sub2API 配置文件(通常是 config.yaml 或在 Web 管理后台的“节点配置”/“上游设置”中)。

你需要添加一个新的上游节点(Upstream)或直接在模型映射中进行绑定。

  • Name/Label: 你可以随意命名,比如 Kimi-MoonshotQwen-Max
  • API Key: 填入你刚才复制的 Key。
  • Base URL: 这是最关键的一步,不同厂商地址不同:
    • Kimi: https://api.moonshot.cn/v1
    • 通义千问: https://dashscope.aliyuncs.com/compatible-mode/v1
    • 智谱 GLM: https://open.bigmodel.cn/api/paas/v4
  • Models: 这里需要填写该 API Key 对应的具体模型名称。注意: 这里填的名称必须与上游平台完全一致,且建议在该字段后加个备注方便区分。
    • Kimi 推荐填入: moonshot-v1-8k, moonshot-v1-32k, moonshot-v1-128k
    • 通义千问推荐填入: qwen-max, qwen-plus, qwen-turbo

3. 客户端映射(可选但推荐)

在 Sub2API 内部,你可能希望将发送来的 gpt-4claude-3.5 请求重定向到这些国产模型,以节省成本或测试效果。你可以在“模型重定向”或“自定义模型”列表中设置:

  • 映射规则:input: gpt-4o-mobile -> output: moonshot-v1-8k
  • 这样,当客户端调用 gpt-4o-mobile 时,Sub2API 会实际请求 Kimi 的接口。

三、 避坑指南与常见问题

Q1: 提示 Model Not FoundInvalid API Key

  • 检查 Model Name: 很多时候是你填的模型名和官方文档不一致。比如通义千问有时用 qwen-max,有时旧接口用 qwen-max-120119,务必查阅最新 API 文档。Kimi 的模型名没有版本后缀,直接填 moonshot-v1-8k 即可。
  • 检查 Base URL: 确保最后带有 /v1,地址是否正确包含 https://

Q2: Kimi 的长文本支持怎么设置?

  • Sub2API 默认可能不传递 max_tokenstemperature 等高级参数到所有上游。如果需要在 Sub2API 客户端指定长上下文,确保你在请求时显式传入了 model 参数,并且该参数在 Sub2API 的白名单或映射表中存在。Kimi 的 moonshot-v1-128k 支持超长上下文,适合做文档总结。

Q3: 并发被限流怎么办?

  • 国产大模型对并发(RPM/TPM)限制比 OpenAI 更严格。建议在 Sub2API 中为这些节点设置合理的 限流策略心跳测试,避免瞬间大流量打挂 Key。可以在管理后台为每个上游节点设置独立的速率限制(如 10 req/min)。

Q4: 结构化输出(JSON Mode)支持吗?

  • Kimi 和 通义千问均支持 response_format: {"type": "json_object"}。如果在 Sub2API 中调用时出现格式错误,请检查请求参数是否正确透传。通常 Sub2API 会原样转发此参数,但如果上游拒绝,会返回 400 Bad Request,此时需检查 Prompt 是否明确要求了 JSON 格式。

四、 进阶技巧:成本优化

接入国产模型最大的优势在于成本。例如 qwen-turbo 的价格远低于 GPT-4,而 qwen-max 在逻辑推理上已接近 GPT-4 Turbo 水平。你可以这样做:

  1. 分流策略:在 Sub2API 中配置权重,将简单的闲聊任务路由到便宜的 qwen-turbomoonshot-v1-8k,将复杂的代码生成路由到 gpt-4glm-4-plus
  2. 缓存复用:开启 Sub2API 的缓存功能(如果支持),对于相同的 Prompt 快速返回结果,进一步降低 Token 消耗。

总结

接入 Kimi、通义千问等国产模型到 Sub2API 并不复杂,关键在于精准的 Base URL正确的模型名称映射。一旦配置成功,你不仅能享受更低的资费,还能利用国产模型在中文语境下的出色表现。赶紧去你的控制台试试吧,记得先小流量测试,确保稳定性后再全量切换!

标签: none

评论已关闭