hex2api 惊现“永动机”模式？实测第二种扣量方式居然不限量

最近折腾 API 中转服务的时候，发现了一个有意思的站点——hex2api。本来以为这就是个普普通通的新聚合站，结果在测试扣费逻辑的时候，居然让我发现了一个有点像“永动机”的计费漏洞。

如果你也是那种喜欢薅羊毛或者需要高频调用大模型的极友，这个发现可能对你非常有用。废话不多说，直接上干货。

hex2api 在后台或者调用逻辑里，隐含了两种不同的扣费（扣量）机制。这个区别很关键，很多人可能第一步走错了就直接劝退了。

1. Credits 积分制（常规模式）

hex2api 界面展示两种扣量模式

hex2api 后台界面，左侧为常规的 Credits 积分制模式，右侧为发现的无上限/隐藏模式。

这是最常见的一种模式。你注册进去，系统会给你分配一个 Credits 额度，比如显示 "0.3 / 10 used"。这种模式就是明码标价的充值消费逻辑：

如果你看到弹窗提示额度不足要升级（就像那个被截屏刷屏的提示一样），说明你正处在这个模式里。一旦切换出去，你会发现新世界。

2. 无限/隐藏模式（“真香”模式）

重点来了！如果在设置里切换到另一种模式（有些可能需要特定的参数配置或者在特定入口进入），情况完全变了：

hex2api 无限模式实测截图

在切换到第二种模式后，成功调用高阶模型（如 GPT-4.7）的界面截图，验证了其无限量的特性。

为什么会出现这种情况？我结合经验瞎猜了一下（不一定准，仅供参考）：

不管原因是什么，只要能跑通，对我们来说就是好羊毛。

虽然第二种模式看似“无限”，但在实际使用中，我也遇到了几个坑，这里给大伙提个醒：

内置提示词干扰：hex2api 好像在这个模式下加了内置的系统提示词。如果你直接跑简单的对话没问题，但如果你是用 it 做复杂的 Prompt Engineering（提示词工程）或者 Agent 开发，可能会发现输出结果奇奇怪怪，总带着站点自带的味道。解决方案：在 System Message 里显式强化你的指令，或者尽量使用 API 模式而非 Web 聊天框来绕过部分 UI 层的干扰。
工具链配置难题：原文作者提到“工具链不会搞只能大牛搞”，这点我有同感。如果你想把它接入到像 LangChain、AutoGPT 这种框架里，因为它不是标准的 OpenAI 格式（或者在 Header 处理上有特殊性），直接填 API Key 可能报错。建议使用官方推荐的 SDK，或者在转发层（如 Nginx 做一次反向代理）把 Header 做一下规范化处理。
稳定性未知：既然是非正常渠道的扣量模式，随时可能被官方修正或者关停。建议：如果是用来做生产环境的业务，请务必慎用；如果是自己写脚本跑脚本、爬虫或者日常瞎折腾，那就尽管薅，薅到一个算一个。

hex2api 的这个“双面人”设计确实给了我们惊喜。如果你手里的 Credits 用完了别急着跑，记得去折腾一下第二种模式，没准就能解锁高阶模型的无限畅玩卡。

当然，这种好东西大概率是“限时福利”，想上车的建议最近这几天抓紧测试。反正我是不打算充值了，先用这个“无限模式”爽几天再说！