最近在搞代码生成的时候,遇到一个挺有意思的现象,必须拿出来和大家唠唠。起因是我手头有个活儿,需要用 AI 帮忙整一段 HTML 代码。按理说这年头大模型写这种基础代码跟玩似的,但我这次却翻车了。

同样的需求,表现天差地别

我有两个常用工具,一个是大家都很熟的 Codex(号称用了 Pro 级别模型),另一个是集成了国产大模型的 WorkBuddy。我抱着不偏不倚的态度,把同样的一长串提示词分别扔给了它们。

Henry2026 头像

作者头像

结果让我非常意外:WorkBuddy 跑完直接给了我能用的 HTML,结构清晰,甚至还帮我补全了我没细说的 CSS 样式;反观 Codex,生成的代码不仅乱七八糟,还缺胳膊少腿,根本没法直接用。

刚开始我还以为是我提示词写得太玄学,或者是对 Codex 的要求太高了?毕竟它是那个“出道即巅峰”的狠角色。但我反复检查了几次,问题不在 Prompt,而在模型本身。这不由得让我怀疑:Codex 莫非也“降智”了?

国产大模型真的支棱起来了

DeepSeek-V4-Pro 模型标志

DeepSeek-V4-Pro 模型

带着好奇心我去扒了一下 WorkBuddy 的配置,发现它背后用的居然是 DeepSeek-V4-Pro

说实话,以前我对国产模型的印象还停留在“这就那样”的阶段,觉得能凑合用就行,但在代码这个强逻辑场景下,DeepSeek 这波表现属实把我惊到了。它不仅在代码准确性上赢了,而且推理能力感觉更“懂”中文开发者的意图。很多时候我们不需要花里胡哨的代码,只要能跑、能看、好改,而 DeepSeek 恰好踩在了这个痛点上。

这就引出了一个很现实的问题:在做日常开发或者简单的代码二创时,我们是不是没必要死磕那些所谓的国际大牌了?

速度与激情的抉择

除了能力问题,群里还有个朋友吐槽 Codex 的 Pro 模型:“现在也上 Pro 了吗?这咋用还得等十几分钟?”

这确实是个大坑对于这种秒级必争的场景,动辄十几分钟的等待简直是折磨。不管是 Codex 调度机制的问题,还是 Pro 模型负载过高,这种体验差到没法忽略。相比之下,国产模型目前的响应速度快了很多,有时候生成的质量不输,还不用你盯着屏幕发呆,这种效率和体验的升维打击是非常明显的。

写在最后:该换枪码了

如果你最近也觉得 Codex 变笨了,或者觉得它生成代码越来越费劲,不妨换个赛道试试。现在技术风向变太快,国产模型像 DeepSeek 这种黑马选手,搞不好就是当下的“版本答案”。

在这里给受困扰的同学几个建议:

  1. 多模型并行测试: 不要迷信单一模型,遇到搞不定的需求,换个国产模型往往有奇效。
  2. 优化提示词上下文: 虽然这次是模型锅,但保持清晰的指令永远没错。
  3. 关注响应速度: 如果你是付费用户,不仅要看能力强不强,还得看回不回消息(生成速度快不快),时间成本也是成本。

这波国产替代的风,看来是刮到咱们码农桌上了。大家最近有没有什么好用的国产模型推荐?欢迎在评论区交流一下避坑心得!

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭