最近各大厂的 AI 模型更新速度真的很快,尤其是国产大模型,几乎是你方唱罢我登场。作为一名经常需要写代码、抠细节的博主,我也忍不住去试了试刚露头的 Qwen 3.7 Max。本来以为号称“编程增强”的版本能给我点惊喜,结果这几天的实测体验下来,只能说:理想很丰满,现实很骨感。

这次测试我特意选了两个非常具体的开发场景,都是我们在日常写代码时经常遇到的“小痛点”。如果连这种基础任务都搞不定,那所谓的“编程助手”也就只能是看看而已了。

场景一:VS Code 插件里的基础功能

第一个任务是颜色值的复制。在写前端 CSS 的时候,我们经常需要用到拾色器。为了提高效率,我希望能实现一个功能:设计稿里选了一个颜色,在编辑器里按一下 c 键,就能直接把 HEX 或 RGB 值复制到剪贴板。

这逻辑听起来很简单吧?无非就是监听键盘事件,获取当前选中的颜色值,然后写入剪贴板。我找了个叫 Qoder 的第三方插件配合 Qwen 模型来跑。结果 Qwen 3.7 Max 给出的代码逻辑一塌糊涂,要么是事件监听没写对,要么是剪贴板 API 调用报错。折腾了好几次,代码是生成了,但在编辑器里根本跑不起来。

场景二:搜索关键词高亮

第二个任务就更基础了,几乎是所有 IDE 的标配功能——高亮搜索关键词。输入一个词,文章或代码里所有匹配的词都要变色高亮。

这个需求对于大模型来说,应该算是送分题。但 Qwen 3.7 Max 的表现再次让我无语。它虽然能写出一堆正则表达式,但在处理 HTML 文本节点的时候,完全忽略了 DOM 结构会把标签打断的问题,导致要么高亮位置不对,要么直接把 HTML 标签给破坏了,页面直接乱码。

Qwen 3.7 Max 实测结果界面截图

Qwen 3.7 Max 在两个基础开发任务(按C复制颜色值、高亮搜索关键词)中的实测结果均告失败。

额度耗尽:还没开始就结束了

最让我心疼的不是任务没跑通,而是这个模型的消耗速度。我也就试了这两个功能,调试了几轮,系统提示 300 额度已经耗尽了。这就很尴尬了,连个像样的 Demo 都没跑出来,资源倒是烧了不少。对于想深度试用或者把它集成到自己工作流里的开发者来说,这种消耗速度简直是在烧钱。

对比之下:还得是 GLM 5.2

实测 Qwen 3.7 Max 无果后,我反手打开了智谱的 GLM 5.2。不得不承认,在编程领域,GLM 5.2 目前确实表现得更加稳。同样扔给 GLM 5.2 这两个任务,它提供的代码逻辑更加严谨,对 API 的理解也更准确,甚至能考虑到一些边界情况(比如空值处理、异步等待等)。

虽然 GLM 5.2 也不是完美无缺,但在国产编程大模型这个赛道上,目前它确实是“顶流”级别的存在。

写在最后

这次测试让我把 Qoder 插件都卸载了,Qwen 也先搁置一边吧。虽然我很期待 Qwen 4.0 版本能打一场翻身仗,但在 4.0 到来之前,如果你想在编程方面找个靠谱的国产 AI 助手,我的建议还是老老实实蹲守 GLM 5.2。

大模型的迭代是很快,但“实测”永远比“参数”来得实在。大家如果最近也在测试新的 AI 模型,欢迎在评论区分享你的避坑经验!

标签: none

评论已关闭