Theia：如何托管 VS Code 插件——plugin-ext-vscode 兼容层的架构与调用路径

Theia 自己有一套前后端扩展模型，但同时又希望复用 VS Code 庞大的插件生态。
这一篇尝试从架构角度讲清楚一件事：Theia 是如何在自己的框架里“托管” VS Code 插件的——从插件发现与 package.json 解析，到 VS Code API 兼容层、激活事件、命令/视图桥接，以及前后端之间的调用路径。

总览：在 Theia 里再起一层 VS Code 风格的「插件宿主」

Theia 在自己的前端/后端之上，再加了一层 VS Code 风格的 Extension Host（由 plugin-ext / plugin-ext-vscode 这块负责），然后通过一个 vscode 兼容 API 和消息通道，把 VS Code 插件“骗”成它们以为自己跑在 VS Code 里。

从高层结构看，大致是这样几块：

Theia 前端应用
- Lumino 应用壳 + 原生前端扩展（命令、菜单、视图、编辑器等）；
- plugin-ext-vscode 前端部分：在浏览器/Electron 侧托管 VS Code 插件前端逻辑，向插件暴露 vscode 命名空间。
Theia 后端应用（Node 进程）
- 原生后端扩展（文件系统、终端、任务、LSP 桥接等）；
- plugin-ext 后端部分：管理插件生命周期，通过 JSON-RPC 为 VS Code API 提供服务端实现。
外部进程
- 各种语言服务器（LSP）、调试适配器、工具进程等。

Theia 要做的是：

既能让 VS Code 插件按自己的习惯写 import * as vscode from "vscode"、配置 activationEvents / contributes；
又能在内部把这些调用转译成对 Theia 自身服务（命令、视图、文件系统、LSP 等）的访问。

第一步：插件发现与 `package.json` 解析

在真正运行 VS Code 插件之前，Theia 需要先把它们识别并抽象成内部可用的信息结构。

大致流程可以拆成几步理解：

1. 扫描扩展位置
- 后端的插件管理服务会在若干位置查找扩展：
  - 本地目录（类似 .theia/extensions）；
  - 已安装的 VSIX 包解压目录；
  - 配置中指定的其他路径。
2. 解析 package.json
- 判断这是一个 VS Code 风格的插件（例如存在 engines.vscode 字段等）；
- 读取：
  - 基本元信息：id（publisher.name）、版本号等；
  - 入口文件：main / browser；
  - activationEvents：扩展何时被激活；
  - contributes：命令、菜单、快捷键、视图、语言等扩展点声明。
3. 转成内部「插件描述对象」
- 后端不会直接把原始 package.json 暴露出去，而是构造一个结构化的插件描述：
  - id、entryPoint、activationEvents、contributes、依赖关系等；
- 通过 JSON-RPC 把这些描述同步给前端的 plugin-ext-vscode 层。

可以把这一步看成是「把 VS Code 风格的扩展描述，翻译成 Theia 能统一管理的插件元数据」。

第二步：`vscode` API 兼容层——把调用“导向” Theia 服务

VS Code 插件代码中最显眼的一行就是：

1import * as vscode from "vscode";

在 Theia 里，并没有真正的 VS Code 运行时，但 plugin-ext-vscode 会提供一个模块，向插件暴露一个形状一致的 vscode 对象：

对插件来说：
- vscode.window.showInformationMessage、vscode.commands.registerCommand、vscode.workspace.openTextDocument 等 API 看起来和 VS Code 一样；
在 Theia 内部：
- 这些 API 的实现基本分为两类：
  - 直接调用 Theia 前端服务（例如 UI 弹窗等）；
  - 通过 JSON-RPC 调用后端的 plugin-ext 服务，由后端再转发给 Theia 的文件系统、任务、LSP 等模块。

例如，可以抽象出类似这样的调用路径：

插件调用：vscode.commands.registerCommand("ext.sayHello", handler)；
前端兼容层：
- 把命令 id 和 handler 注册到一个「本地 VS Code 插件命令表」；
- 同时通过 RPC 告诉 Theia 命令系统：有一个新的命令 id 需要挂进来；
当用户在 Theia 内部触发这个命令时：
- 命令系统发现命令来源于 VS Code 插件；
- 通过插件宿主层把执行请求发回 plugin-ext-vscode；
- 由兼容层调用当初注册的 handler。

从心智模型上看：

vscode 命名空间在 Theia 中就是一层「代理 API」：向上看像 VS Code，向下看接的是 Theia 自己的服务与消息通道。

第三步：激活与生命周期——仿真 VS Code 的 `activationEvents`

VS Code 插件依赖 activationEvents 来控制何时激活，Theia 需要在自己环境下「重现」这套机制。

整体思路可以拆解为：

1. 收集所有插件的激活条件
- 从每个插件的 package.json 中读取 activationEvents：
  - onCommand:xxx、onLanguage:typescript、onStartupFinished、* 等；
- 在 plugin-ext-vscode 中维护一张「事件 → 需要激活的插件列表」的映射。
2. 监听 Theia 中对应的运行时事件
- 命令执行：当某个命令 id 第一次被触发时；
- 文档/语言：当某种语言的文件被打开时；
- 启动生命周期：Theia 前端完成初始化、工作区加载等。
3. 触发对应插件的加载与 activate 调用
- 当某个事件到来时，兼容层判断：有没有 VS Code 插件声明对这个事件感兴趣；
- 如果有，就按照 VS Code 的习惯：
  - 在插件宿主中加载该扩展的入口模块（main/browser）；
  - 调用其导出的 activate(context) 函数；
  - 返回一个 ExtensionContext，上下文中包含：
    - 存储路径；
    - subscriptions 集合（用来统一释放资源）；
    - 其他和 VS Code 一致的上下文信息。

到这里，插件就进入了「已激活」状态，后续的命令注册、视图注册、事件监听都会开始生效。

第四步：命令 / 菜单 / 视图等贡献点的「桥接」

仅有 vscode API 还不够，Theia 还需要处理 VS Code 插件在 package.json 里声明的 contributes 部分。

可以按类别看一下它们是怎么被「桥接」到 Theia 的：

命令（contributes.commands）
- 兼容层读取插件声明的命令 id、标题、分类（category）；
- 在 Theia 的命令系统中注册对应的命令「占位符」，标记为 “VS Code 插件命令”；
- 真正的执行逻辑仍然通过前面说的 vscode.commands.registerCommand 绑定在插件宿主里。
菜单（contributes.menus）
- 将 VS Code 的菜单位置（如 editor/context、explorer/context、editor/title 等）映射到 Theia 的菜单模型；
- 在相应位置挂上执行这些命令的菜单项。
快捷键（contributes.keybindings）
- 解析每条 keybinding 规则，把 command / key / when 映射到 Theia 的 keybinding 注册接口；
- when 里的上下文表达式尽量翻译成 Theia 支持的上下文键（无法完全一致的部分则退化处理或不支持）。
视图（contributes.views / viewsContainers）
- 对 TreeView / Webview 视图，Theia 会提供对应的「VS Code 风格容器」；
- 当视图需要展示时，通过插件宿主调用 VS Code TreeDataProvider/Webview API，再把返回的数据/内容映射为 Theia 前端 UI。
语言（contributes.languages / grammars 等）
- 用于告知 Theia 支持哪些语言 id、文件扩展名、语法高亮定义；
- 后续再通过 LSP 客户端、Monaco 语言注册等能力落地。

从外观看，Theia 的菜单/命令/视图中多了很多来自 VS Code 插件的东西；
从内部看，这些扩展点都通过 plugin-ext-vscode 被「翻译」成 Theia 的命令模型、菜单模型和视图抽象。

第五步：前后端调用路径——从 VS Code API 到 Theia 服务

很多 VS Code API 背后都有真实的后端依赖（文件系统、调试器、语言服务器、任务系统等），Theia 需要在自己的后端服务上模拟这些行为。

可以用几种典型场景来感受一下调用路径：

文件相关（vscode.workspace 系列）
- 插件调用 openTextDocument / save / findFiles 等；
- 前端兼容层将请求通过 JSON-RPC 发到后端 plugin-ext；
- 后端再调用 Theia 的文件系统服务（以及工作区服务）获取数据或执行操作；
- 最后结果通过相同通道返回插件。
编辑器增强（vscode.languages、vscode.window 相关）
- 注册 CompletionProvider / HoverProvider / CodeLensProvider 等：
  - 兼容层记录提供者；
  - 当 Theia 的编辑器（基于 Monaco）触发相应事件时，向兼容层查询有哪些 VS Code 插件的 provider 需要被调用；
  - 通过消息通道调用插件提供的 provide* 方法，并把结果转换为 Monaco/Theia 识别的数据结构。
任务 / 调试 / 终端
- 类似地，vscode.tasks、vscode.debug、vscode.window.createTerminal 等 API 会被转发到 Theia 对应模块，或由 plugin-ext 做再一层适配。

可以把这一层总结成：

VS Code API 调用 → 前端兼容层 → JSON-RPC → Theia 后端服务 / LSP / 工具进程 → 结果返回。

中间的大量代码工作，都在做「类型转换 + 协议适配」：
既要保持 VS Code API 的语义不变，又要贴合 Theia 现有服务模型。

兼容性的边界与取舍

虽然 Theia 在兼容 VS Code 插件方面做了很多工作，但在技术上仍然有一些天然边界：

API 覆盖度并非 100%
- 高频使用的编辑器/工作区/命令/语言相关 API 通常都有实现；
- 某些新引入或非常 VS Code 内建场景（尤其是 Deep Debug/Remote 相关）的 API 可能未完全覆盖或行为稍有不同。
UI 行为与布局差异
- VS Code 对某些内置视图/面板有自己的布局与行为假设，这些假设不一定能在 Lumino + Theia 的布局体系中完整复刻；
- 严重依赖 VS Code 内建视图 id 或内部行为的插件，跑在 Theia 上时需要额外验证。
内建扩展依赖
- 一些 VS Code 插件依赖特定的内建扩展（如内置 TypeScript 扩展、内置 Git 扩展），而 Theia 可能有不同的实现或根本没有对应实现。

从工程实践角度，可以合理设定预期：

面向通用编辑器能力、语言服务、简单视图/命令/快捷键的 VS Code 插件，在 Theia 上通常可以比较顺畅地复用；
深度耦合 VS Code 内核或内建扩展行为的插件，更适合评估后改写为 Theia 原生扩展，或者针对性做适配层。

小结：一条可以在脑子里复现的调用路径

把这一篇压缩成一条你可以随时在脑中 replay 的主线，大致是：

Theia 后端扫描 VS Code 插件、解析 package.json，把它们转成内部的插件描述对象；
前端 plugin-ext-vscode 向插件暴露 vscode 兼容 API，并根据 activationEvents 控制何时加载/调用 activate；
contributes 部分被翻译成 Theia 的命令/菜单/快捷键/视图/语言扩展点，Theia 的 UI 中因此多出这些 VS Code 插件挂上的入口；
VS Code API 调用都会先进入兼容层，再通过 JSON-RPC 和 Theia 的服务、LSP、工具进程对接，最后结果回到插件；
在这个过程中，Theia 本身的前后端扩展模型仍然是「地基」，VS Code 插件只是被托管在上面的一层「兼容宿主」中运行。

在后续如果要继续深入看源码，可以从 plugin-ext / plugin-ext-vscode 这一块入手：
先找「VS Code API 兼容实现模块」、插件描述/激活管理类，再顺着命令、视图、语言等具体扩展点的桥接代码往下看，会比直接从整个仓库入口往里扎要清晰很多。