AI 算力新变局？Etched 芯片流片完成，用低电压和 SRAM+HBM 组合拳破局

最近 AI 领域最卷的除了大模型，可能就是底层的算力芯片了。虽然英伟达现在还是老大的地位，但总有人想通过“奇技淫巧”来弯道超车。这不，一家叫 Etched 的初创公司刚刚宣布完成了芯片流片（Tape Out），他们的思路挺特别，咱们今天就来扒一扒。

芯片流片过程中的晶圆示意图，展示从设计到物理实体的转变

图1：芯片流片是指将设计图纸送往晶圆厂试生产的过程，是芯片研发中的关键一步。

01. 什么是“流片”？为什么这事儿重要？

先给不熟悉半导体术语的朋友科普一下，“流片”简单说就是芯片设计图纸定稿后，送去晶圆厂试生产第一批样品。这就像程序员代码写完了，终于到了编译上线跑一下的环节。一旦流片成功，意味着芯片设计从理论变成了物理实体，后续就是测试和量产了。Etched 这一步迈出去，至少说明他们的架构设计已经通过了基本的物理验证。

SRAM 与 HBM 混合缓存架构示意图，展示数据在高速缓存与高带宽内存间的流动

图2：Etched 采用 SRAM + HBM 的组合拳策略，旨在打破“内存墙”瓶颈，提升数据吞吐效率。

02. 低电压：换个思路提算力

Etched 这次的宣传点之一是“低电压提升实际算力表现”。大家通常提升算力的思路是堆更多核心、跑更高频率，但副作用是功耗爆炸，芯片热得像火炉。

Etched 尝试通过降低工作电压来解决问题。根据物理学公式，功耗与电压的平方成正比（$P \propto V^2$），稍微降一点点电压，功耗就能大幅下降。对于数据中心来说，这意味着同样的电力能带动更多的芯片运行。而且，在低电压状态下，芯片的稳定性反而可能更好，这或许能让他们在极限频率下跑得更稳，从而在单位时间内完成更多的推理任务。这对于主要跑 AI 推理的场景（比如对话机器人、图片生成）来说，是个非常实惠的优化。

03. 存储架构：SRAM + HBM 的组合拳

AI 芯片的瓶颈从来都不全是计算单元的快慢，更多时候是“内存墙”——数据搬运的速度跟不上计算的速度。Etched 在这块采用了 SRAM + HBM 的混合缓存策略。

SRAM（静态随机存取存储器）：速度极快，通常集成在芯片核心旁边，用来存放最“热”的数据。虽然成本高、密度低，但胜在低延迟。
HBM（高带宽内存）：也就是现在高端显卡常用的那种堆叠内存，带宽巨大，专门用来喂吃饱那些计算核心。

把这两者结合起来，其实是在打造一个“多级缓存”系统：常用的参数放 SRAM，大块的模型权重放 HBM。这种设计如果能调度得当，就能有效减少数据搬运的等待时间，让计算核心一直处于“吃饱饭”的状态，而不是空转等数据。对于 Transformer 这类对显存带宽极其敏感的架构来说，这种优化非常关键。

04. 未来的影响与思考

虽然 Etched 还没有公布具体的跑分数据，但这个技术路线给人的感觉是“务实”。与其盲目堆砌参数，不如在能效比和数据吞吐上做文章。

如果这款芯片后续实测表现不错，对于中小型 AI 公司和开发者来说是个好消息。毕竟，不是谁都买得起满血版的 H100。如果能用更低的电费和更少的硬件投入跑起 Stable Diffusion 或者 LLaMA，那绝对是值得期待的“新风向”。

当然，硬件只是基础，软件生态和 CUDA 兼容性才是最大的坎。咱们拭目以待，看看这颗芯片落地后，能不能真的给 AI 圈子来一点小小的物理震撼。

AI 算力新变局？Etched 芯片流片完成，用低电压和 SRAM+HBM 组合拳破局

01. 什么是“流片”？为什么这事儿重要？

02. 低电压：换个思路提算力

03. 存储架构：SRAM + HBM 的组合拳

04. 未来的影响与思考

评论已关闭

最新文章

最近回复

分类

归档

其它