Trellis 工作流踩坑实录：DeepSeek V4 Pro 为何触发不了 Hook？

在当下的 AI 开发生态里，Trellis 作为一款强大的工作流编排工具，深受不少开发者的青睐。特别是对于想要将各种大模型能力串联起来，实现自动化流程的小伙伴来说，它简直就是刚需。

Trellis 工作流编排工具界面示意图

Trellis 工作流编排工具界面示意图

不过，最近踩了一个“深坑”，不得不说一下，希望能帮大家避雷。

工作流中断示意图

工作流中 Hook 失效导致流程中断

情况是这样的：公司内部为了节省成本，目前只提供了免费的 DeepSeek V4 Pro 模型接口。本来想着能把这股“薅羊毛”的精神发挥到极致，直接把它接入到 Trellis 的工作流里，跑一跑自动化任务。

GPT-4o 与 DeepSeek 模型能力对比

GPT-4o 与 DeepSeek 模型能力对比

结果一跑起来，傻眼了。工作流中的各种 Hook（钩子）几乎全都不生效。 不管是前置条件判断，还是步骤流转后的回调，模型就像是没看到一样，愣是一顿操作猛如虎，最后啥也没触发，直接“摆烂”结束。

Function Calling 机制原理图

Function Calling 机制原理图

Prompt 优化技巧

通过强化 System Prompt 解决模型输出问题

为了搞清楚是不是我自己写的 Workflow 节点有问题，我特意做了个对比测试。我换用了 CPA（某种中转服务/API 聚合）提供的 GPT-4o 模型（也就是大家常说的 gpt5.5 这类高阶模型）。

结果非常直接：同样的节点配置，同样的 Prompt，GPT-4o 大部分都能正常触发 Hook，逻辑跑得飞起。

这就排除了 Trellis 配置失误的可能性，锅大概率得背在 DeepSeek 身上。

这其实涉及到很多国产模型与主流闭源模型在 “工具调用” 能力上的训练差异。

训练数据侧重点不同：像 GPT-4o 这种模型，经过了海量的 Function Calling 场景微调，非常擅长理解“我在什么情况下需要调用这个工具/函数”。而 DeepSeek 虽然 coding 能力很强，但在这种结构化工作流的“指令遵循”和“工具触发”逻辑上，可能还没完全对齐工业级 Workflow 的标准。
Prompt 解析敏感度：Trellis 这类工具通常对模型输出的格式有严格要求。DeepSeek 有时候会出现“脑补”现象，它虽然理解了你的意图，但返回的不是标准的 JSON 结构或者触发词，导致 Trellis 的解析器无法识别，自然就错过了 Hook。
API 限制或版本问题：有时候公司内部提供的免费接口，可能是特定版本的蒸馏版或者阉割版，在 Function Calling 的支持上不如官方完整版那么激进。

如果你也遇到了类似问题，别急着放弃，可以尝试以下几个排查和优化步骤：

强化 Prompt（System Prompt）：在 DeepSeek 的 System Prompt 里强行加入约束，明确告诉它：“你必须严格按照 JSON 格式输出”，“遇到 X 条件必须输出 Y 触发词”。虽然治标不治本，但有时候能骗过模型的逻辑层。
检查 API 参数：确认你在调用 DeepSeek API 时，是否开启了 tools 或 functions 相关参数。有些时候默认模式只是普通的对话模式，模型根本不知道自己有“触发工具”的权限。
考虑 OpenSpec 方案：原文中提到的准备切到 OpenSpec 是一个非常务实的方向。手工维护繁琐的 OpenAPI Spec 文档确实让人头秃，但如果能通过代码自动生成 OpenSpec，或者利用 DeepSeek 本身的理解能力去辅助生成 Spec，再集成到工作流中，可能会比强制它去适应 Trellis 的 Hook 逻辑要顺滑得多。这相当于把“调用工具”的复杂度下放到了规范层，而不是靠模型去“猜”。

虽然 DeepSeek 性价比极高，但在涉及到复杂的 Agent 工作流 和 严谨的工具链编排 时，兼容性问题确实不容忽视。

如果你的业务对稳定性要求极高，目前阶段，GPT-4o 依然是更稳妥的选择。但如果必须用 DeepSeek，那就做好“Prompt 工程”或者“中间层适配”的准备，别指望它能像 GPT 一样开箱即用。

希望这个踩坑记录能给正在折腾 LLM 工作流的朋友们一点参考，别忘了点个赞，我们下期见！