Claude 与 Cursor 风格 IDE 助手：一个可能的架构拆解

这一篇不去猜具体实现细节，而是站在工程视角，拆一套“像 Claude / Cursor 这样的 IDE 助手大概率会长成什么样”的架构，把关键组件和数据流说明白。

整体视角：客户端插件 + 后端服务 + 模型层

可以先粗暴地把这类 IDE 助手拆成三大块：

客户端插件 / IDE 集成层
- 针对 VS Code / Cursor / JetBrains / Web IDE 的插件；
- 负责 UI（侧边栏、内联补全、悬浮气泡）和本地文件交互。
后端服务层
- 会话管理：用户、项目、对话历史；
- 代码索引服务：符号索引、向量索引、搜索；
- 任务编排：决定什么时候调哪个模型、用什么 prompt 模板。
模型层
- 聊天模型：偏自然语言理解/解释；
- 代码模型：偏补全、重构、生成测试；
- 工具调用能力：让模型可以显式调用“读文件、列目录、跑测试”等工具。

从 IDE 到模型的典型路径是：

客户端插件一般掌握 IDE 的很多细节信息：

这些信息会被打包成一个结构化请求，大致包括：

客户端本身通常不直接调用大模型，而是把这些东西发给后端的一个统一入口。

在后端，典型会有一个“编排层”来处理这类请求，大致步骤是：

这一层会做不少“脏活累活”：兜底错误、重试、节流、日志和埋点。

为了支撑“理解整个项目”的体验，后端通常会维护一个项目级索引：

符号/引用索引：
- 哪个符号在哪里定义、被哪些地方用到；
- 可以快速回答“这个函数所有调用点在哪”。
向量索引（Embedding）：
- 按函数/类/文件片段为单位，把代码转成 embedding；
- 给定当前函数或 bug 描述，找语义上最相关的代码块。
文档索引：
- 把 README、设计文档、内嵌注释等也索引进来；
- 帮模型理解业务语义和约定。

AI 助手很多“看起来很懂整个项目”的行为，其实都是：

模型本身并不真的“记住了你的整个仓库”，而是每次请求都在和索引服务配合。

对于“帮我改代码”这类请求，结果不能只是文本，还要能变成真正的文件修改。
常见的做法是让模型直接输出结构化 patch，例如：

客户端拿到这些 patch 之后，可以：

这样一来，模型负责“提出改动建议”，IDE 负责“安全落地”和“交互体验”。

在像 Cursor 这样的产品里，通常会有清晰的边界控制：

后端则需要：

这些约束会反过来影响“上下文构造”和“索引设计”，是工程里必须考虑的一环。

把这一套可能的架构放在心里，再看 Claude、Cursor 之类在 IDE 里的表现，会更容易理解：

从这个视角看，“Claude/Cursor 风格”的 IDE 助手更多是：