第12章 IDE Bridge 通信架构

"Any sufficiently advanced CLI is indistinguishable from an IDE." -- 改自 Arthur C. Clarke

本章要点

双模 Bridge 架构 -- Claude Code 通过两条路径实现 CLI 与 IDE 的桥接：独立进程 Bridge（bridgeMain.ts）用于 claude remote-control 命令行场景，REPL Bridge（replBridge.ts）用于 VS Code/JetBrains 等 IDE 内嵌场景
环境-会话两层模型 -- Environment 注册建立宿主机与服务器的信任通道，Session 在通道内承载具体的对话生命周期，两层解耦使一个 Bridge 可服务多个并发会话
JWT 令牌生命周期管理 -- 从可信设备注册、OAuth 令牌交换到 session_ingress JWT 的主动续期，形成完整的认证链条，支持长达数小时的持续会话
指数退避与容量感知 -- 轮询循环区分连接错误和通用错误两条退避轨道，结合系统休眠检测和容量唤醒信号，在可靠性与服务器友好之间取得平衡
权限决策跨进程转发 -- 当子进程 CLI 需要工具执行权限时，control_request 经 Bridge 转发到 IDE/Web UI，决策结果以 control_response 回传，闭环完成跨进程权限对话

引言：从命令行到编辑器的桥梁

Claude Code 诞生于终端，但它的战场不仅限于终端。当一位开发者在 VS Code 中选中一段代码并请求 Claude 帮忙重构时，当另一位开发者在 JetBrains IDE 中让 Claude 分析整个项目结构时，他们所依赖的，是一套在 CLI 进程与 IDE 扩展之间搭建的精密通信管道 -- Bridge。

Bridge 的设计面临一个本质性矛盾：Claude Code 的核心能力（模型调用、工具执行、沙箱隔离、权限管理）全部实现在一个 Node.js/Bun 进程中，而 IDE 扩展运行在另一个完全不同的进程空间。如何让两端高效、安全、可靠地协作，是本章的核心命题。

更具挑战性的是，Bridge 不是简单的请求-响应管道。它需要处理长时间运行的会话（一个编码任务可能持续数小时）、支持多窗口并发（开发者可能在多个 IDE 标签页中同时使用 Claude）、在网络断开时优雅恢复、在 IDE 重启时无缝重连。这些需求交织在一起，催生了 Claude Code 中最复杂的子系统之一。

本章将从底层通信协议到上层会话管理，从认证安全到容错恢复，全面剖析 Bridge 的设计与实现。

12.1 为什么需要 Bridge

12.1.1 CLI 与 IDE 的鸿沟

Claude Code 作为一个 CLI 工具，天然运行在终端进程中。它拥有完整的工具系统、权限模型、流式对话引擎。但 IDE 扩展运行在另一个进程 -- VS Code 扩展运行在 Electron 的扩展宿主进程中，JetBrains 插件运行在 JVM 进程中。两者之间没有共享内存，不能直接调用函数。

最朴素的集成方式是让 IDE 扩展直接嵌入一个 Claude Code 运行时，但这不现实。Claude Code 的依赖链庞大（Bun 运行时、数百个 npm 模块、系统级沙箱组件），硬塞进 IDE 扩展会严重膨胀包体积，还会引发版本同步噩梦 -- 每次 Claude Code 更新，所有 IDE 扩展都要同步发布新版。

Bridge 模式的核心洞见是：让 Claude Code 继续运行在独立进程中，IDE 扩展只需要一个轻量的通信客户端。这样，Claude Code 的全部能力（包括沙箱、权限、MCP 协议等）对 IDE 透明可用，版本升级只需更新 CLI 本身。IDE 扩展的职责被简化为"消息的搬运工" -- 从用户界面收集输入，转交给 Bridge，然后把 Bridge 返回的结果渲染到编辑器中。

这种架构还带来了一个额外的好处：可测试性。Bridge 的所有行为都可以通过模拟的 API 客户端和 session spawner 进行单元测试，不依赖真实的 IDE 进程。类型定义中 BridgeApiClient、SessionSpawner、BridgeLogger 等接口的设计，正是为了这种可注入的测试模式。

12.1.2 两种集成场景

Claude Code 的 Bridge 架构服务于两种截然不同的场景：

独立进程 Bridge（Standalone Bridge）：开发者在终端运行 claude remote-control，启动一个持久运行的 Bridge 进程。这个进程向服务器注册为一个"环境"（Environment），然后持续轮询等待来自 claude.ai Web 界面或 IDE 扩展的任务。每个任务到达时，Bridge 会 spawn 一个子 Claude Code 进程来执行。这是 bridgeMain.ts 的职责。

REPL 内嵌 Bridge（REPL Bridge）：当开发者在 IDE 中使用 Claude Code 扩展时，扩展在后台启动一个 Claude Code REPL 进程。这个 REPL 进程内部初始化一个 Bridge 连接，将对话状态同步到 claude.ai Web 界面，同时接收来自 Web 端的输入和控制指令。这是 replBridge.ts 和 initReplBridge.ts 的职责。

两种模式共享大量基础设施 -- API 客户端、JWT 管理、消息协议、重试逻辑 -- 但在会话生命周期管理上有本质区别。独立 Bridge 是"一对多"的（一个 Bridge 进程服务多个会话），REPL Bridge 是"一对一"的（一个 REPL 进程对应一个 Bridge 会话）。

除了这两种模式之外，源码中还存在第三种变体：remoteBridgeCore.ts 实现的"无环境层 Bridge"。这是一种更新的 v2 直连模式，它完全绕过 Environments API 的工作派发层，直接通过 POST /v1/code/sessions/{id}/bridge 端点获取 worker JWT 和 epoch，建立 SSE+CCRClient 传输。这种模式消除了注册/轮询/确认/停止/心跳/注销的环境生命周期管理开销，使连接建立更加轻量。三种模式的存在反映了 Bridge 子系统正处于从轮询式架构向直连式架构的渐进迁移过程中。

12.1.3 VS Code 与 JetBrains 的统一抽象

无论是 VS Code 还是 JetBrains IDE，从 Bridge 的视角看都是"远端客户端"。Bridge 不直接与任何 IDE 通信 -- 它通过 claude.ai 的服务器作为中介：

IDE 扩展 <---> claude.ai 服务器 <---> Bridge 进程 <---> Claude Code CLI

这种间接通信的设计意味着 Bridge 不需要为每种 IDE 编写适配层。IDE 扩展只需实现 claude.ai 的 Web API 客户端，就能与 Bridge 交互。新增对 Neovim 或 Emacs 的支持，不需要修改 Bridge 的任何代码。

从特性门控的角度来看，Bridge 功能需要满足多项前置条件才能激活。bridgeEnabled.ts 中的 isBridgeEnabledBlocking 函数展示了这些条件的层叠结构：首先检查编译期特性标志（feature('BRIDGE_MODE')，通过 Bun bundler 的死代码消除确保外部构建不包含 Bridge 字符串字面量）；然后检查用户是否为 claude.ai 订阅者（排除 Bedrock/Vertex/API key 用户）；最后检查 GrowthBook 开关（tengu_ccr_bridge）是否对当前组织启用。任何一项不满足，Bridge 功能对用户完全不可见。这种多层门控保证了功能的灰度发布可以按组织维度精确控制。

12.2 Bridge 架构总览

下图展示了 Bridge 的两种运行模式及其与 IDE 和 Claude Code CLI 之间的通信路径：

12.2.1 目录结构与职责划分

src/bridge/ 目录包含 30 多个 TypeScript 文件，构成了 Bridge 子系统的完整实现。按职责可划分为以下几个层次：

src/bridge/
  |-- 核心流程
  |     |-- bridgeMain.ts        # 独立Bridge的主循环：注册→轮询→分发→清理
  |     |-- replBridge.ts        # REPL Bridge核心：注册→连接→消息转发→重连
  |     |-- initReplBridge.ts    # REPL Bridge初始化：鉴权门控、参数准备、动态导入
  |     |-- remoteBridgeCore.ts  # 无环境层Bridge核心（v2直连模式）
  |
  |-- 会话管理
  |     |-- sessionRunner.ts     # 子进程生命周期：spawn→监控→清理
  |     |-- createSession.ts     # 会话创建：POST /v1/sessions API
  |     |-- sessionIdCompat.ts   # 会话ID标签转换（cse_* <-> session_*）
  |
  |-- 通信传输
  |     |-- replBridgeTransport.ts  # 传输层抽象：v1(WebSocket) / v2(SSE+CCR)
  |     |-- bridgeMessaging.ts      # 消息路由：入站解析、类型守卫、去重
  |     |-- inboundMessages.ts      # 入站消息处理：附件解析
  |     |-- inboundAttachments.ts   # 附件下载与转换
  |     |-- flushGate.ts            # 初始消息刷新状态机
  |
  |-- API 客户端
  |     |-- bridgeApi.ts         # 环境API封装：注册/轮询/确认/停止/心跳
  |     |-- codeSessionApi.ts    # 会话API封装（v2直连模式）
  |     |-- workSecret.ts        # 工作密钥解码、SDK URL构建、Worker注册
  |
  |-- 认证安全
  |     |-- jwtUtils.ts          # JWT解码与令牌刷新调度器
  |     |-- trustedDevice.ts     # 可信设备注册与令牌管理
  |     |-- bridgeConfig.ts      # Bridge配置读取（OAuth令牌、API地址）
  |
  |-- 容错与配置
  |     |-- pollConfig.ts        # 轮询间隔配置（GrowthBook动态调参）
  |     |-- pollConfigDefaults.ts # 轮询间隔默认值
  |     |-- capacityWake.ts      # 容量唤醒信号（会话结束→立即轮询）
  |     |-- bridgeEnabled.ts     # 特性门控（订阅检查、GrowthBook开关）
  |
  |-- 类型定义
  |     |-- types.ts             # 核心类型：BridgeConfig, SessionHandle, WorkResponse...
  |     |-- bridgePermissionCallbacks.ts  # 权限回调类型定义
  |
  |-- 辅助工具
        |-- bridgeUI.ts          # 状态显示：Banner、会话进度、QR码
        |-- bridgeStatusUtil.ts  # 状态格式化工具
        |-- bridgePointer.ts     # 崩溃恢复指针（持久化环境/会话ID）
        |-- bridgeDebug.ts       # 调试故障注入（ant用户专用）
        |-- debugUtils.ts        # 调试日志工具
        |-- envLessBridgeConfig.ts  # 无环境层配置（v2模式）

12.2.2 bridgeMain.ts：独立 Bridge 的主循环

bridgeMain.ts 是独立 Bridge 模式的核心，其主函数 runBridgeLoop 实现了一个完整的服务器长轮询循环。这个文件超过 1600 行，是整个 Bridge 子系统中最大的单一文件。它的宏观结构如下：

typescript

// 文件: src/bridge/bridgeMain.ts

export async function runBridgeLoop(
  config: BridgeConfig,
  environmentId: string,
  environmentSecret: string,
  api: BridgeApiClient,
  spawner: SessionSpawner,
  logger: BridgeLogger,
  signal: AbortSignal,
  backoffConfig: BackoffConfig = DEFAULT_BACKOFF,
  initialSessionId?: string,
  getAccessToken?: () => string | undefined | Promise<string | undefined>,
): Promise<void> {
  // 1. 初始化活跃会话跟踪表
  const activeSessions = new Map<string, SessionHandle>()
  const sessionWorkIds = new Map<string, string>()
  const sessionIngressTokens = new Map<string, string>()
  // ...

  // 2. 创建令牌刷新调度器
  const tokenRefresh = getAccessToken
    ? createTokenRefreshScheduler({ getAccessToken, onRefresh, label: 'bridge' })
    : null

  // 3. 进入主轮询循环
  while (!loopSignal.aborted) {
    const pollConfig = getPollIntervalConfig()
    try {
      const work = await api.pollForWork(environmentId, environmentSecret, ...)
      // 4. 处理工作项（session / healthcheck）
      // 5. 管理容量和休眠策略
    } catch (err) {
      // 6. 错误恢复（指数退避）
    }
  }

  // 7. 优雅关闭：SIGTERM→等待→SIGKILL→archive→deregister
}

这个循环的关键设计决策在于**先确认后生产（ack-after-commit）**模式。当 Bridge 从服务器拉取到一个工作项时，它不会立即确认（ack），而是先解码工作密钥、验证会话 ID、检查容量，确认能够处理后才调用 acknowledgeWork。如果确认后子进程 spawn 失败，Bridge 会调用 stopWork 通知服务器，防止工作项永久丢失。

12.2.3 replBridge.ts：REPL 会话桥接

与独立 Bridge 不同，REPL Bridge 运行在 Claude Code 的交互式 REPL 进程内部。它不需要 spawn 子进程 -- 因为 REPL 本身就是执行引擎。REPL Bridge 的核心函数 initBridgeCore 负责：

向服务器注册一个 Bridge 环境
创建一个会话（或复用崩溃恢复指针中的已有会话）
建立 WebSocket/SSE 传输连接
将 REPL 的对话消息实时同步到服务器
接收来自 Web 端的用户输入和控制指令

initBridgeCore 返回一个 ReplBridgeHandle，REPL 的其他模块通过这个句柄与 Bridge 交互：

typescript

// 文件: src/bridge/replBridge.ts

export type ReplBridgeHandle = {
  bridgeSessionId: string
  environmentId: string
  sessionIngressUrl: string
  writeMessages(messages: Message[]): void        // 同步对话消息到服务器
  writeSdkMessages(messages: SDKMessage[]): void   // 直接写SDK消息
  sendControlRequest(request: SDKControlRequest): void   // 发送控制请求
  sendControlResponse(response: SDKControlResponse): void // 发送控制响应
  sendControlCancelRequest(requestId: string): void       // 取消权限请求
  sendResult(): void                               // 通知会话结束
  teardown(): Promise<void>                        // 拆除Bridge连接
}

12.2.4 initReplBridge.ts：REPL Bridge 的门控与初始化

REPL Bridge 的初始化不是直接调用 initBridgeCore，而是通过 initReplBridge.ts 中间层完成。这个中间层承担了所有与 REPL 状态相关的工作，使 initBridgeCore 保持"无引导状态依赖"（bootstrap-free），便于非 REPL 场景（如 Agent SDK daemon）复用。

initReplBridge 的门控链展示了 Bridge 启用的多层条件：

typescript

// 文件: src/bridge/initReplBridge.ts

export async function initReplBridge(
  options?: InitBridgeOptions,
): Promise<ReplBridgeHandle | null> {
  // 1. 运行时特性门控（GrowthBook 开关）
  if (!(await isBridgeEnabledBlocking())) {
    return null
  }

  // 2. OAuth 认证检查（必须登录 claude.ai）
  if (!getBridgeAccessToken()) {
    onStateChange?.('failed', '/login')
    return null
  }

  // 3. 策略合规检查（组织策略是否允许 Remote Control）
  // 4. 最低版本检查（防止过旧客户端连接）
  // 5. 收集 Git 上下文（仓库 URL、分支名）
  // 6. 委托给 initBridgeCore 执行实际注册和连接
}

之所以拆分为两个文件，原因在源码注释中有明确说明：sessionStorage 的导入会传递性地拉入 src/commands.ts（整个斜杠命令注册表和 React 组件树，约 1300 个模块）。将 initBridgeCore 放在不触碰 sessionStorage 的文件中，让 Agent SDK daemon 可以导入核心逻辑而不膨胀构建产物。

12.2.5 sessionRunner.ts：子进程生命周期管理

在独立 Bridge 模式下，每个从 claude.ai 派发的任务都会被 spawn 为一个独立的 Claude Code 子进程。sessionRunner.ts 的 createSessionSpawner 工厂函数负责创建这些子进程并管理其生命周期。

子进程 spawn 时携带的关键参数揭示了 Bridge 的通信机制：

typescript

// 文件: src/bridge/sessionRunner.ts

const args = [
  ...deps.scriptArgs,
  '--print',                         // 非交互模式
  '--sdk-url', opts.sdkUrl,          // WebSocket/HTTP 接入点
  '--session-id', opts.sessionId,    // 会话标识
  '--input-format', 'stream-json',   // NDJSON 输入
  '--output-format', 'stream-json',  // NDJSON 输出
  '--replay-user-messages',          // 回放历史用户消息
]

const env: NodeJS.ProcessEnv = {
  ...deps.env,
  CLAUDE_CODE_OAUTH_TOKEN: undefined,           // 剥离Bridge的OAuth令牌
  CLAUDE_CODE_ENVIRONMENT_KIND: 'bridge',       // 标识运行环境
  CLAUDE_CODE_SESSION_ACCESS_TOKEN: opts.accessToken, // 会话专用JWT
}

Bridge 与子进程之间通过三个标准 IO 管道通信：

stdin：Bridge 向子进程写入控制消息（如令牌刷新、环境变量更新）
stdout：子进程输出 NDJSON 格式的事件流（助手回复、工具调用、权限请求）
stderr：子进程的错误输出，Bridge 维护一个环形缓冲区（最近 10 行）用于故障诊断

SessionHandle 是 Bridge 对子进程的控制句柄，它暴露了精确的生命周期操作：

typescript

// 文件: src/bridge/types.ts

export type SessionHandle = {
  sessionId: string
  done: Promise<SessionDoneStatus>        // 进程退出的 Promise
  kill(): void                            // 发送 SIGTERM
  forceKill(): void                       // 发送 SIGKILL
  activities: SessionActivity[]           // 活动环形缓冲区（最近10条）
  currentActivity: SessionActivity | null // 最新活动
  accessToken: string                     // 会话令牌
  lastStderr: string[]                    // stderr 环形缓冲区
  writeStdin(data: string): void          // 写入 stdin
  updateAccessToken(token: string): void  // 刷新令牌（通过stdin下发）
}

令牌更新的实现尤其巧妙 -- Bridge 不需要重启子进程来刷新认证：

typescript

// 文件: src/bridge/sessionRunner.ts

updateAccessToken(token: string): void {
  handle.accessToken = token
  handle.writeStdin(
    jsonStringify({
      type: 'update_environment_variables',
      variables: { CLAUDE_CODE_SESSION_ACCESS_TOKEN: token },
    }) + '\n',
  )
}

子进程的 StructuredIO 模块会处理 update_environment_variables 消息，直接更新 process.env，使后续的 API 调用自动使用新令牌。整个过程对子进程的应用层完全透明。

12.3 通信协议

12.3.1 双版本传输协议

Bridge 的传输层经历了从 v1 到 v2 的演进，两套协议并行存在并由服务器端特性开关控制：

v1 协议（HybridTransport）：基于 WebSocket 的混合传输。读取方向使用 WebSocket 接收服务器推送的事件，写入方向使用 HTTP POST 发送消息。这种"读 WS + 写 POST"的混合设计是因为 WebSocket 的写入在高并发下不够可靠（消息可能乱序或丢失），而 HTTP POST 天然保证请求级别的原子性。

v2 协议（SSE + CCRClient）：读取方向使用 Server-Sent Events（SSE）流，写入方向通过 CCRClient 调用 CCR v2 的 /worker/* REST 端点。v2 的核心优势在于跳过了 Session-Ingress 层的 WebSocket 代理，直接与 CCR 通信，减少了一层延迟和故障点。

replBridgeTransport.ts 将两种协议统一到同一个接口背后：

typescript

// 文件: src/bridge/replBridgeTransport.ts

export type ReplBridgeTransport = {
  write(message: StdoutMessage): Promise<void>
  writeBatch(messages: StdoutMessage[]): Promise<void>
  close(): void
  isConnectedStatus(): boolean
  getStateLabel(): string
  setOnData(callback: (data: string) => void): void
  setOnClose(callback: (closeCode?: number) => void): void
  setOnConnect(callback: () => void): void
  connect(): void
  getLastSequenceNum(): number          // SSE序列号高水位
  readonly droppedBatchCount: number    // 静默丢弃的批次数
  reportState(state: SessionState): void    // 报告工作状态（v2专用）
  reportMetadata(metadata: Record<string, unknown>): void
  reportDelivery(eventId: string, status: 'processing' | 'processed'): void
  flush(): Promise<void>                // 清空写入队列
}

第12章 IDE Bridge 通信架构 ​

引言：从命令行到编辑器的桥梁 ​

12.1 为什么需要 Bridge ​

12.1.1 CLI 与 IDE 的鸿沟 ​

12.1.2 两种集成场景 ​

12.1.3 VS Code 与 JetBrains 的统一抽象 ​

12.2 Bridge 架构总览 ​

12.2.1 目录结构与职责划分 ​

12.2.2 bridgeMain.ts：独立 Bridge 的主循环 ​

12.2.3 replBridge.ts：REPL 会话桥接 ​

12.2.4 initReplBridge.ts：REPL Bridge 的门控与初始化 ​

12.2.5 sessionRunner.ts：子进程生命周期管理 ​

12.3 通信协议 ​

12.3.1 双版本传输协议 ​

第12章 IDE Bridge 通信架构

引言：从命令行到编辑器的桥梁

12.1 为什么需要 Bridge

12.1.1 CLI 与 IDE 的鸿沟

12.1.2 两种集成场景

12.1.3 VS Code 与 JetBrains 的统一抽象

12.2 Bridge 架构总览

12.2.1 目录结构与职责划分

12.2.2 bridgeMain.ts：独立 Bridge 的主循环

12.2.3 replBridge.ts：REPL 会话桥接

12.2.4 initReplBridge.ts：REPL Bridge 的门控与初始化

12.2.5 sessionRunner.ts：子进程生命周期管理

12.3 通信协议

12.3.1 双版本传输协议