workBuddy怎么用？模型选择技巧帮你省下一大笔Token消耗！

最近在折腾各种AI辅助工具，发现一个叫workBuddy的东西，用下来感觉确实有点东西。今天不聊虚的，直接上手教大家怎么用它来“薅羊毛”——也就是怎么在保证效果的前提下，把Token消耗降到最低。

简单来说，这是一个聚合型的AI工具，它最大的特点就是灵活。很多朋友用这类工具，不管干什么活儿，上来就默认GPT-4或者Claude 3.5 Sonnet，结果没聊几句账单就爆了。workBudy的核心优势就在于它允许你对不同类型的任务选择不同的模型，这就是省钱的关键。

我们要知道，大模型的使用成本主要来自于Token（输入+输出）。高端模型（比如GPT-4o）虽然聪明，但价格也高得离谱；而一些轻量级模型或者开源模型（如Llama 3、Qwen等），在处理简单任务时，效果和顶级模型差别并不大，但价格可能只有几十分之一。

AI大模型价格对比示意图

不同大模型（如GPT-4与Llama 3）的使用成本对比图，直观展示价格差异

这就好比搬家：

workBuddy就是让你能把这个“选人”的权力握在自己手里。

如果你只是问它“今天天气怎么样”或者“帮我把这段话润色一下”，完全没必要上大模型。在workBuddy的模型设置里，指向一些性价比极高的中端模型。响应速度通常更快，体验丝滑，消耗几乎可以忽略不计。

做自媒体的朋友经常需要阅读长文并生成摘要。这个任务对于模型的逻辑推理要求没那么高，主要考验的是上下文理解能力。选择参数量适中的模型，配合长上下文窗口，既便宜又好使。

程序员使用AI进行编程工作

在处理复杂代码编写和逻辑任务时，使用顶级AI模型能极大提升效率

这可是重头戏。涉及到Debug、架构设计或者复杂的算法实现，千万别省。这时候就应该在workBuddy中切换回顶级的闭源模型。虽然一次消耗多一点，但能帮你省下去医院挂号看Bug的时间，这笔账怎么算都划算。

光选对模型还不够，写好Prompt能进一步帮你省Token。

workBuddy这类工具给了我们极大的自由度，能把AI工具真正变成“按需分配”的私人助理。别再无论啥活儿都一把梭哈GPT-4了，学会精细化管理模型选择，不仅能显著降低成本，还能在不同场景下获得最快的响应速度。

建议大家赶紧去试试设置不同的Profile（配置文件），为“代码/工作”、“娱乐/闲聊”、“翻译/润色”分别指定不同的模型，体验一下精打细算的快乐！