OpenClaw
OpenClaw 与当前大模型发展阶段讨论总结
1. OpenClaw 为什么突然火起来
OpenClaw 最近在 AI 社区受到关注,主要原因是它将 AI 从“对话工具”扩展为“可执行任务的智能体系统”。
核心变化:
- 从 Chatbot → Agent
- AI 不只是回答问题,而是可以执行任务
- 可以自动调用工具、运行脚本、访问 API
- 可以持续运行而不是一次请求
示例能力:
- 自动整理邮件
- 自动监控网站
- 自动生成报告
- 自动执行代码
因此很多人称它为:
“数字员工框架” 或 “AI Agent 操作系统”。
2. OpenClaw 的主要技术创新点
OpenClaw 的创新不在单一技术,而在 系统架构整合。
核心能力包括:
2.1 Agent Runtime(持续运行的 AI)
传统 LLM:
1请求 → 回复 → 结束
OpenClaw:
1任务
2 ↓
3思考
4 ↓
5调用工具
6 ↓
7继续思考
8 ↓
9任务完成
即 长期运行的 AI Agent 进程。
2.2 工具调用系统(Tool / Skills)
AI 可以调用外部工具:
示例:
- Web Search
- 文件系统
- 浏览器自动化
- Python 执行
- API 调用
AI 根据任务自动选择工具。
2.3 Memory 系统
OpenClaw通常提供三类记忆:
- 短期记忆(当前任务)
- 长期记忆(历史信息)
- 向量记忆(RAG检索)
常见存储:
- 向量数据库
- SQL
- 文件系统
2.4 多模型路由
支持多个大模型:
- OpenAI
- Anthropic
- 本地模型(Ollama)
不同任务可选择不同模型。
3. OpenClaw 源码级架构
接近真实代码结构:
1openclaw/
2├── cmd/ # CLI入口
3├── gateway/ # 消息网关
4├── agents/ # agent运行逻辑
5├── providers/ # 模型适配
6├── channels/ # 外部平台接入
7├── tools/ # 工具系统
8├── memory/ # AI记忆
9├── storage/ # 数据存储
10└── sdk/ # 扩展接口
核心模块说明:
CLI
系统启动与管理:
1openclaw start
2openclaw agent create
Gateway
核心控制平面:
负责:
- API
- WebSocket
- 消息路由
- agent调度
Agent Runtime
系统核心逻辑:
包含:
1Planner
2Executor
3Context Manager
执行循环:
1任务输入
2→ LLM 推理
3→ 选择工具
4→ 执行工具
5→ 返回结果
6→ 下一步推理
Tool Manager
管理所有工具:
例如:
1web_search
2browser
3filesystem
4python_exec
LLM Router
统一调用不同模型:
1写代码 → Claude
2总结 → GPT
3简单任务 → 本地模型
4. OpenClaw 权限模型是否类似 RBAC
OpenClaw 的设计 表面类似 RBAC,但本质不同。
RBAC 模型
1User → Role → Permission → Resource
OpenClaw 模型
1Agent → Capability → Tool → Resource
对应关系:
| RBAC | OpenClaw |
|---|---|
| User | Agent |
| Role | Agent配置 |
| Permission | Capability |
| Resource | Tool |
但区别是:
RBAC 是 静态权限系统
OpenClaw 是 动态决策系统。
AI 会在运行时选择:
1思考 → 选择tool → 执行
因此更接近:
Capability-based security
5. Edict 项目(OpenClaw实现)的意义
Edict 是一个基于 OpenClaw 的 多 Agent 协作实验。
设计灵感来自中国古代:
三省六部制
系统结构:
1用户
2 ↓
3太子(消息分拣)
4 ↓
5中书省(规划)
6 ↓
7门下省(审核)
8 ↓
9尚书省(调度)
10 ↓
11六部(执行)
Edict 的价值
1. Multi-Agent 组织结构探索
不同框架协作方式:
| 框架 | 协作模式 |
|---|---|
| AutoGen | 对话 |
| CrewAI | pipeline |
| LangGraph | DAG |
| Edict | 官僚流程 |
2. 引入治理层
增加:
1Planner
2 ↓
3Reviewer
4 ↓
5Executor
减少错误规划。
3. 可观测性
提供 dashboard:
- agent 状态
- 任务流程
- 日志
Edict 的局限
- agent 数量过多
- 本质仍是 workflow
- 很多逻辑依赖 prompt
因此更像:
多 agent 架构实验。
6. 大模型发展是否进入“复杂度换性能阶段”
部分是的,但不是全部。
目前能力增长主要来自三类计算:
1训练计算
2+
3推理计算
4+
5系统架构
6.1 Scaling(模型规模)
通过增加:
- 参数量
- 数据量
- 训练计算
提升能力。
6.2 推理计算(test-time compute)
推理时增加思考:
例如:
1chain-of-thought
2tree-of-thought
3self-consistency
用时间换准确度。
6.3 系统增强
能力来自:
1LLM
2 + RAG
3 + Tools
4 + Memory
5 + Agents
7. 为什么感觉 AI 进展变慢
原因:
1. 训练成本爆炸
1GPT-3 ≈ 几千万美元
2GPT-4 ≈ 数亿美元
3未来模型可能 >10亿美元
2. benchmark 接近饱和
很多测试:
- MMLU
- GSM8K
- coding benchmark
已接近人类水平。
3. 推理能力瓶颈
LLM仍然弱于:
- 长链推理
- 复杂规划
- 世界模型
8. 未来可能的突破方向
研究界主要探索:
1. 继续 Scaling
更大模型。
2. 推理计算
推理时增加计算。
3. 新架构
可能替代 Transformer。
例如:
- State Space Models
- Mixture of Experts
- Modular networks
4. AI 系统化
能力来自系统:
1LLM
2 + Agent
3 + Tool
4 + Memory
OpenClaw 属于这一方向。
总结
OpenClaw 的核心意义在于:
将 LLM 从“对话模型”变为“可执行任务的 AI 系统”。
它通过:
- Agent Runtime
- Tool System
- Memory
- 多模型路由
构建了一个 AI Agent 运行环境。
而当前 AI 发展阶段:
既有 算力扩展,也在探索 新架构与系统化 AI。