AI 算力新变局?Etched 芯片流片完成,用低电压和 SRAM+HBM 组合拳破局
最近 AI 领域最卷的除了大模型,可能就是底层的算力芯片了。虽然英伟达现在还是老大的地位,但总有人想通过“奇技淫巧”来弯道超车。这不,一家叫 Etched 的初创公司刚刚宣布完成了芯片流片(Tape Out),他们的思路挺特别,咱们今天就来扒一扒。
图1:芯片流片是指将设计图纸送往晶圆厂试生产的过程,是芯片研发中的关键一步。
01. 什么是“流片”?为什么这事儿重要?
先给不熟悉半导体术语的朋友科普一下,“流片”简单说就是芯片设计图纸定稿后,送去晶圆厂试生产第一批样品。这就像程序员代码写完了,终于到了编译上线跑一下的环节。一旦流片成功,意味着芯片设计从理论变成了物理实体,后续就是测试和量产了。Etched 这一步迈出去,至少说明他们的架构设计已经通过了基本的物理验证。
图2:Etched 采用 SRAM + HBM 的组合拳策略,旨在打破“内存墙”瓶颈,提升数据吞吐效率。
02. 低电压:换个思路提算力
Etched 这次的宣传点之一是“低电压提升实际算力表现”。大家通常提升算力的思路是堆更多核心、跑更高频率,但副作用是功耗爆炸,芯片热得像火炉。
Etched 尝试通过降低工作电压来解决问题。根据物理学公式,功耗与电压的平方成正比($P \propto V^2$),稍微降一点点电压,功耗就能大幅下降。对于数据中心来说,这意味着同样的电力能带动更多的芯片运行。而且,在低电压状态下,芯片的稳定性反而可能更好,这或许能让他们在极限频率下跑得更稳,从而在单位时间内完成更多的推理任务。这对于主要跑 AI 推理的场景(比如对话机器人、图片生成)来说,是个非常实惠的优化。
03. 存储架构:SRAM + HBM 的组合拳
AI 芯片的瓶颈从来都不全是计算单元的快慢,更多时候是“内存墙”——数据搬运的速度跟不上计算的速度。Etched 在这块采用了 SRAM + HBM 的混合缓存策略。
- SRAM(静态随机存取存储器):速度极快,通常集成在芯片核心旁边,用来存放最“热”的数据。虽然成本高、密度低,但胜在低延迟。
- HBM(高带宽内存):也就是现在高端显卡常用的那种堆叠内存,带宽巨大,专门用来喂吃饱那些计算核心。
把这两者结合起来,其实是在打造一个“多级缓存”系统:常用的参数放 SRAM,大块的模型权重放 HBM。这种设计如果能调度得当,就能有效减少数据搬运的等待时间,让计算核心一直处于“吃饱饭”的状态,而不是空转等数据。对于 Transformer 这类对显存带宽极其敏感的架构来说,这种优化非常关键。
04. 未来的影响与思考
虽然 Etched 还没有公布具体的跑分数据,但这个技术路线给人的感觉是“务实”。与其盲目堆砌参数,不如在能效比和数据吞吐上做文章。
如果这款芯片后续实测表现不错,对于中小型 AI 公司和开发者来说是个好消息。毕竟,不是谁都买得起满血版的 H100。如果能用更低的电费和更少的硬件投入跑起 Stable Diffusion 或者 LLaMA,那绝对是值得期待的“新风向”。
当然,硬件只是基础,软件生态和 CUDA 兼容性才是最大的坎。咱们拭目以待,看看这颗芯片落地后,能不能真的给 AI 圈子来一点小小的物理震撼。

评论已关闭