最近科技圈又炸锅了,仿佛回到了当初 GPT-4 发布前夜那种躁动不安的感觉。各路爆料大神纷纷出动,矛头直指两个巨头:OpenAI 和 Google DeepMind。据传,我们很快就会迎来 GPT-5.6 和 Gemini 3.5 Pro 的正面硬刚。

GPT-5.6:下周见?额度松绑是关键

首先是 OpenAI 方面的消息。科技博主 leo 爆料称,OpenAI 可能会在 7 月 7 日至 9 日 这个时间段对公众开放全新的 GPT-5.6 模型。最早的时间节点甚至指向了 7 月 7 日,也就是说,可能当你看到这篇文章的时候,它已经来了,或者马上就要来了。

大家最关心的肯定不是那个版本号,而是:更好用了吗?更便宜了吗?

根据目前的传闻流,GPT-5.6 不仅仅是参数上的微调,重点在于“新模型套餐额度会更宽松”。众所周知,GPT-4o 的高昂价格和限流一直是重度用户的心病。如果 GPT-5.6 能在保持甚至提升推理能力的同时,大幅降低使用门槛或提供更慷慨的免费额度,那绝对是生产力级别的提升。此外,OpenAI 为了应对新模型可能带来的风险,据说还在上线前加强了安全策略,看来是想避免发布即“翻车”的尴尬。

Gemini 3.5 Pro:硬核堆料,200万上下文窗口

另一边,Google DeepMind 也没闲着。据传被暂定于 7 月 17 日 上线的 Gemini 3.5 Pro,这次主打的就是一个“大”字。

博主 Astro Polo 的爆料称,Gemini 3.5 Pro 将支持 200 万 token(2M)的上下文窗口。这是什么概念?

  • 对比竞品:目前 Claude Sonnet 5、Claude Opus 4.8 等主打长文本的模型,通常也就支持 100 万 token 左右的上下文。Gemini 3.5 Pro 一上来就是翻倍的规格,参数上直接碾压。
  • 实际应用:这意味着你可以一次性把整个大型代码库、几千页的技术文档或者几个月的会议记录直接扔给它,而不用担心它“忘了开头”。对于程序员、律师和研究人员来说,这绝对是个杀手锏级别的功能。

画饼还是真香?“滑动窗口”的痛点

虽然参数听着很美,但在吃瓜群众的眼里,这波操作更多引发的是对实战能力的质疑。

很多老用户对 Gemini 的长上下文能力保持“审慎乐观”甚至悲观态度,原因就在于它的“滑动窗口”机制。简单来说,就是模型虽然理论上能吃进 200 万 token,但它可能会“顾头不顾尾”,在处理超长文本时,中间部分的信息可能会被压缩丟失。

有资深玩家评论道:“Gemini 那个滑动窗口,别说 2M 了,我看 200M 也是卵用没有。” 还有人吐槽:“别说 2M 了,0.2M 之内的可用性提高一点吧!” 确实,如果连短文本的逻辑都不能完美咬合,盲目堆砌上下文长度,最后可能只会变成模型在那儿不停地复读“极其极其极其极其”这种废话。

总结与展望

这就引出了一个问题:我们到底需要多大的上下文?

  • 如果你只是日常写写文案、画画图,现有的 128k 甚至 32k 上下文其实已经完全够用了,GPT-5.6 如果能提升响应速度和逻辑连贯性,体验会更佳。
  • 如果你是做 RAG(检索增强生成)或者需要分析海量数据的硬核开发者,Gemini 3.5 Pro 的 2M 上下文确实值得期待,但前提是 Google 得解决好“注意力机制”的有效性问题,别让这么长的窗口变成了摆设。

下周就是 GPT-5.6 的预计上线时间,究竟是不负众望的“王炸”,还是平淡无奇的“挤牙膏”,我们拭目以待。而十天后的 Gemini 3.5 Pro,能否真正兑现 2M 上下文的承诺,也是一场硬仗。

不管怎样,作为普通用户,这是最好的时代——大模型军备竞赛越激烈,我们薅到的羊毛(更好的免费/低价模型)也就越多。准备好你们的 Key,咱们下周见分晓!

GPT vs Gemini 概念图

科技圈两大巨头即将迎来新一轮的模型更新竞赛

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭