B站数码博主都在吹的NAS跑AI，到底是不是智商税？

最近刷B站数码区，感觉风向全变了。以前大家还在纠结NAS选几盘位、用什么硬盘，现在好像不聊几句“本地部署大模型”、“离线AI助手”就显得这就不够极客似的。

特别是那个被称为“万金油”的某型号NAS（懂的都懂，395这个数字快被盘出油了），被各种UP主捧上了天。什么“隐私安全”、“断网也能用”、“跑Hermes模型丝般顺滑”……看着确实挺诱人。

但我今天必须得泼盆冷水：如果你真信了这些话直接冲，大概率是要交智商税的。

被刻意忽略的“首字”噩梦

这些推荐视频通常有个共同点：只展示模型已经跑起来后的生成速度，绝口不提“思考”的时间。

在AI领域，这叫“Prefill”（预填充）或“Time to First Token”（首字延迟）。简单说，就是你问完问题后，AI在那儿嗡嗡响、风扇狂转，但半天憋不出第一个字的那段时间。

对于家用NAS这种算力捉急的设备，这段时间往往是以秒甚至分钟为单位计算的。

我自己之前就信了邪，看了几个UP主的介绍，冲动下单了一台热门型号（没错，就是那个被吹爆的机子）。到手后兴冲冲地部署了Hermes模型，结果呢？我问个问题，泡杯面回来，它还在那儿“思考中”。甚至好几次直接超时报错，字都没蹦出来一个。

这就好比你买了一辆跑车，宣传图上全是高速漂移，结果你一点火，预热要等半小时，谁受得了？

这时候我就纳闷了，体验这么明显的卡顿，为什么视频里看着那么流畅？

我想只有两种可能：

纯脚本演示：他们可能根本没真正高频使用，只是录制了一段最完美的生成过程，把前面漫长的等待全剪掉了。
避重就轻：也许他们根本不跑复杂的思维链（CoT），也不搞长文本推理。如果你只是让AI“写个小红书文案”或者“讲个冷笑话”，那确实快。但真正的本地AI玩家，谁不想试试Code Interpreter或者复杂的逻辑推理？这时候对算力的需求完全是另一个量级。

而且，很多人根本不用CC（Command Line）或者高级推理框架，就在个简单的WebUI里简单交互，根本没触发高负载场景，自然觉得“挺好用的”。

别被“本地AI”这个词忽悠了。想要体验不打折，硬件配置是有硬性门槛的。

如果你真的想在本地玩AI，要么攒个带独显的高配台式机，要么老老实实上云端API。指望一台几千块的NAS既当好文件服务器，又当好AI算力中心，目前的硬件水平下，实在是强“N”所难。

给大家几个实在的建议，省得花钱买罪受：

技术是好技术，但营销不能太离谱。希望大家在追逐“新风向”的时候，能保持一点理性。别让那些为了流量的UP主，拿着你的钱给厂商众筹测试费。你们手里的NAS真的跑AI了吗？体验到底咋样？欢迎在评论区真实吐槽，防止更多兄弟踩坑！