解决 Claude Code for VSCode 接入 GPT 模型后同步模式导致的响应卡顿问题

最近把 GPT 模型通过 CC-switch 接入 Claude Code for VSCode 写代码时，发现一个明显的问题：回答过程中，中转站大量采用同步模式，整体体感速度比在 Codex 里用要慢不少。如果你也遇到同样的情况，可以尝试以下几个排查和优化方向。

1. 检查 CC-switch 的路由配置

Claude Code 设置界面

VSCode 插件中的流式传输设置示例

2. 确保 Claude Code 正确开启流式

在 VSCode 插件的设置项里，检查是否已启用 Streaming/SSE 选项；有时默认关闭会导致回调走非流式。
如果 Claude Code 插件支持自定义 API Base 和 Headers，可尝试增加典型的流式标记（例如 Accept: text/event-stream）来对齐预期。

3. 优化服务端/中转节点性能

4. 日志与网络排查

开启 CC-switch 与 VSCode 的调试日志，观察返回体的 Content-Type 是不是 text/event-stream。当服务端频繁回退同步模式时，日志通常会出现明显的变化点。
如果网络环境存在明显的丢包或不稳定，可尝试切换线路或使用加速方案，保持连接稳定有助于流式模式保持。

5. 其他可选方案

总体来看，把 GPT 用在 Claude Code 的场景里，关键还是保持端到端的流式通路。一旦中转或插件侧走入同步兜底，速度下降和卡顿就很难避免。如果你有更好的设置经验或踩过类似坑，欢迎留言分享你的方案。