最近折腾 API 中转服务的时候,发现了一个有意思的站点——hex2api。本来以为这就是个普普通通的新聚合站,结果在测试扣费逻辑的时候,居然让我发现了一个有点像“永动机”的计费漏洞。

如果你也是那种喜欢薅羊毛或者需要高频调用大模型的极友,这个发现可能对你非常有用。废话不多说,直接上干货。

两种扣量模式,体验天差地别

hex2api 在后台或者调用逻辑里,隐含了两种不同的扣费(扣量)机制。这个区别很关键,很多人可能第一步走错了就直接劝退了。

1. Credits 积分制(常规模式)

hex2api 界面展示两种扣量模式

hex2api 后台界面,左侧为常规的 Credits 积分制模式,右侧为发现的无上限/隐藏模式。

这是最常见的一种模式。你注册进去,系统会给你分配一个 Credits 额度,比如显示 "0.3 / 10 used"。这种模式就是明码标价的充值消费逻辑:

  • 逻辑清晰:用多少扣多少,比例固定。
  • 硬性限制:一旦额度用完,接口会直接返回提示,让你“升级”或者充值才能继续使用。
  • 适用场景:适合想稳定使用、不想折腾的常规用户。

如果你看到弹窗提示额度不足要升级(就像那个被截屏刷屏的提示一样),说明你正处在这个模式里。一旦切换出去,你会发现新世界。

2. 无限/隐藏模式(“真香”模式)

重点来了!如果在设置里切换到另一种模式(有些可能需要特定的参数配置或者在特定入口进入),情况完全变了:

  • 无显式上限:在这个模式下,我反复测试,发现系统不再显示传统的“剩余多少刀”或者“剩余多少次”的限制。
  • 高阶模型随便用:本来以为这种免费/隐藏模式只能用低端模型,结果我试了 GPT-5.5 和 GPT-4.7,居然都能正常调用!响应速度也没明显变慢。
  • 感觉像无限量:目前测试下来,只要不是恶意并发轰炸,它似乎真的没有硬性的用量封顶机制,给人一种“量管够”的错觉。

现象分析与可行性推演

hex2api 无限模式实测截图

在切换到第二种模式后,成功调用高阶模型(如 GPT-4.7)的界面截图,验证了其无限量的特性。

为什么会出现这种情况?我结合经验瞎猜了一下(不一定准,仅供参考):

  1. 新站福利期:可能站点目前处于推广期,为了留住用户,放开了部分高级模型的限制,以此来测试服务器负载。
  2. 计费逻辑 BUG:也有可能是程序员小哥写扣费逻辑的时候,把第二种模式的判断条件写漏了,导致只有第一种模式才走计费网关,第二种直接透传了。
  3. 流量置换:也许这个模式本身就是为了收集数据或者为了展示模型效果,所以暂时开放了权限。

不管原因是什么,只要能跑通,对我们来说就是好羊毛。

实测体验与注意事项

虽然第二种模式看似“无限”,但在实际使用中,我也遇到了几个坑,这里给大伙提个醒:

  • 内置提示词干扰:hex2api 好像在这个模式下加了内置的系统提示词。如果你直接跑简单的对话没问题,但如果你是用 it 做复杂的 Prompt Engineering(提示词工程)或者 Agent 开发,可能会发现输出结果奇奇怪怪,总带着站点自带的味道。解决方案:在 System Message 里显式强化你的指令,或者尽量使用 API 模式而非 Web 聊天框来绕过部分 UI 层的干扰。
  • 工具链配置难题:原文作者提到“工具链不会搞只能大牛搞”,这点我有同感。如果你想把它接入到像 LangChain、AutoGPT 这种框架里,因为它不是标准的 OpenAI 格式(或者在 Header 处理上有特殊性),直接填 API Key 可能报错。建议使用官方推荐的 SDK,或者在转发层(如 Nginx 做一次反向代理)把 Header 做一下规范化处理。
  • 稳定性未知:既然是非正常渠道的扣量模式,随时可能被官方修正或者关停。建议:如果是用来做生产环境的业务,请务必慎用;如果是自己写脚本跑脚本、爬虫或者日常瞎折腾,那就尽管薅,薅到一个算一个。

总结

hex2api 的这个“双面人”设计确实给了我们惊喜。如果你手里的 Credits 用完了别急着跑,记得去折腾一下第二种模式,没准就能解锁高阶模型的无限畅玩卡。

当然,这种好东西大概率是“限时福利”,想上车的建议最近这几天抓紧测试。反正我是不打算充值了,先用这个“无限模式”爽几天再说!

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭