最近科技圈有个消息挺让人振奋的,据 Polymarket 上的数据显示,智谱AI(Zhipu AI)最新发布的模型,在发现安全漏洞的能力上,表现已经非常接近名为 Mythos 的顶尖模型了。

Polymarket数据显示智谱AI新模型在安全漏洞发现能力上接近Mythos

智谱AI最新模型在发现安全漏洞的能力上已接近顶尖模型Mythos

说实话,这个进步速度确实有点快。

什么是 Mythos?为什么这个对比很重要?

在聊智谱之前,得先说说 Mythos 在圈内的地位。在网络安全和 AI 辅助渗透测试领域,能够精准发现代码漏洞、识别潜在攻击面的模型并不多。Mythos 一直被视为“特种兵”级别的存在,它在各类安全基准测试中的分数往往代表着业界的标杆。

以前,大家普遍认为通用大模型在逻辑推理和代码生成上进步神速,但在“攻防”这种极度依赖深度专业知识和对抗性思维的细分领域,OpenAI 或 Anthropic 的产品不一定能完全降维打击。而现在,智谱的模型能在硬指标上逼近 Mythos,说明国产模型在垂直领域的“深度”上已经上了一个大台阶。

“Won't take that long”的含金量

看到这个消息,我不由得想起了前段时间智谱团队的大牛唐杰回复马斯克的那句话。当时马斯克还在质疑 AI 的发展进度或某种能力,唐杰的回应非常简短有力:“Won't take that long”(不会花那么久)。

那时候可能还有人觉得这是在“画饼”或者打嘴炮,但放在现在这个时间节点来看,这句话的含金量就有了实打实的数据支撑。从通用对话到复杂的代码逻辑分析,再到如今安全漏洞挖掘能力的爆发,这恰恰印证了国产大模型并没有掉队,反而在某些特定赛道上开始展现“弯道超车”的迹象。

AI 搞安全:是福是祸?

作为技术博主,看到这一进步既兴奋又有一丝“凉凉”的感觉。

兴奋的是,以后程序员和安全研究员手里的武器更强了。以前审计代码靠肉眼、靠经验,费时费力还容易漏。现在有了这种接近专家级的 AI 辅助,扫描数万行代码寻找 SQL 注入、XSS 或者逻辑漏洞可能也就是几分钟的事。这对于提升企业软件的整体安全性绝对是革命性的。

担心的是,技术本身是中立的。如果白帽子能用 AI 快速找漏洞,黑产能不能用 AI 快速写 Exploit(利用脚本)?当攻击和防御的成本都因为 AI 而指数级降低时,网络安全的战场可能会变得更加白热化。

写在最后

智谱这次的成绩单,其实就是国产大模型“卷”出来的结果。除了能聊天、能写周报,现在的 AI 模型正在疯狂向更深的专业领域渗透。

对于我们普通开发者或者安全爱好者来说,这无疑是个好消息。这意味着我们很快就能用上更强悍的本地化工具(毕竟对国内开发者来说,智谱的 API 访问门槛显然比国外的更低)。

不过,技术在进步,大家对 AI 的认知也得跟上。别再只把大模型当成搜索增强版的聊天机器人了,在你不注意的时候,它们可能已经在代码深处帮你拦下了致命的 Bug。

这就叫技术红利,能不能吃到,就看咱们怎么用了。

标签: none

评论已关闭