最近科技圈最大的瓜,莫过于 GPT-5.6 的预热和试运行。虽然官方还没铺天盖地地宣传,但各种泄露消息和系统卡片已经让大家(尤其是开发者)摩拳擦掌了。今天咱们不整虚的,直接把目前能确认的参数、价格策略还有那些让人又爱又恨的限制扒个干净,看看这次升级到底是不是“真香”现场。

一、 三款型号:Pro 的味道越来越浓了

这次 GPT-5.6 似乎不再是一刀切的产品,而是针对不同场景直接分成了三个明显的梯队:

  1. GPT-5.6-Sol:旗舰款,对标之前的顶级模型,甚至号称性能直逼传说中的 Fable(这也太自信了)。这是给重头戏任务准备的。
  2. GPT-5.6-Terra:中坚力量。价格适中,但性能居然敢对标上一代的高端产品(比如 5.5 和 Sonnet 5)。这很明显是为了取代老款中端模型,性价比拉满。
  3. GPT-5.6-Luna:入门款。主打快速响应和低成本,适合处理不需要深度推理的简单任务。

二、 钱包保卫战:价格与缓存策略

价格永远是咱们最关心的,这次 OpenAI 的定价逻辑有点意思,咱们直接上干货(单位均为美元):

  • Sol (旗舰)

    • 输入:$5 / 输出:$30
    • 点评:价格基本对标之前的旗舰 Opus($5/$25),稍微贵了一丢丢,但既然敢叫板 Fable,这个溢价如果是真的,那对于预算充足的企业用户来说可以接受。
  • **Terra (中端) **

    • 输入:$2.5 / 输出:$15
    • 点评:这是个杀手锏。对标前代 5.4 的价格,但性能号称追上了 5.5 和 Sonnet 5。这意味着你用更低的钱,买到了上一代旗舰的性能,这波羊毛必须薅。
  • Luna (入门)

    • 输入:$1 / 输出:$6
    • 点评:对标 5.4-mini 和 Haiku,价格略高一点点,但只要推理能力不掉链子,这个区间依然是大多数轻量应用的首选。

特别注意:缓存涨价了!

GPT-5.6 模型价格策略对比图

GPT-5.6 三款型号的定价详情,包括输入输出价格及缓存成本对比。

这次有个隐蔽的涨价点:写缓存。 以前 5.5 时代,写缓存通常是输入价格的 1 倍,现在 5.6 变成了 1.25 倍。这意味着如果你大量使用 Prompt Cache(缓存提示词)技术,成本会上涨 25%。好在读缓存依然维持原样,还是输入价格的 10%,这点算是不幸中的万幸。

三、 速度狂飙:Cerebras 芯片入局

如果你觉得现在的推理速度还不够快,那接下来的消息你应该会喜欢。

虽然普通版的 5.6 速度参数还没完全公开,但消息称在 7 月份 将推出运行在 Cerebras 芯片上的高速版本。这玩意儿直接把吞吐量拉到了 750 TPS(每秒 Token 数)!这是什么概念?就是快到飞起。不过这个高速版的具体价格还没定,估计不会便宜,但对于那些对延迟极其敏感的应用(比如实时语音对话)来说,这绝对是神技。

四、 上下文与推理能力

  • 上下文窗口:官方没明说,但根据目前的 Codex 限制和 API 支持,大概率还是延续了 5.5 的配置,API 层面支持 1M 上下文(虽然 Codex 里可能限制在 400k)。这对于处理超长文档来说是个好消息。
  • 推理强度:这次新增了 Max effort 模式。这意味着在处理复杂逻辑题或代码生成时,模型会“想”得更久,烧更多的算力来换取更准确的答案。如果你遇到之前模型“脑子转不过弯”的情况,这个模式或许能解决痛点。

五、 最大的门槛:想用?得排队!

这里要泼一盆冷水了。虽然参数看着很美,但目前 GPT-5.6 暂时只对少量企业用户开放

GPT-5.6 Cerebras 高速芯片速度测试

运行在 Cerebras 芯片上的 GPT-5.6 极速版本,吞吐量高达 750 TPS。

这就有点像当年的 GPT-4 早期测试版,需要政府批准,还是逐个企业审核。PolyMarket(那个预测市场)给出的公众开放时间预测中位数是 7 月 13 日左右。至于到时候是像 Fable 那样仅限老美用户,还是全球开放,现在还是个迷。咱们国内个人开发者,大概率还得再等等,或者先去折腾一下 API 的逆向接口(当然,风险自担)。

总结:要不要冲?

这次 GPT-5.6 的升级,尤其是 Terra 版本,给人一种“背刺”上一代产品的感觉——同价性能暴涨。Sol 版本则是在探索智能体的上限,配合 Max effort 模式,估计会在代码和复杂推理上有肉眼可见的提升。

GPT-5.6 系统卡概览

GPT-5.6 系统卡展示,包括上下文窗口和 Max effort 推理模式说明。

对于还在观望的朋友,建议先关注一下 7 月初 Cerebras 高速版的实跑测试。毕竟,参数是死的,实际跑出来的速度和准确率才是硬道理。

标签: none

评论已关闭