OpenClaw

OpenClaw 与当前大模型发展阶段讨论总结

1. OpenClaw 为什么突然火起来

OpenClaw 最近在 AI 社区受到关注，主要原因是它将 AI 从“对话工具”扩展为“可执行任务的智能体系统”。

核心变化：

从 Chatbot → Agent
AI 不只是回答问题，而是可以执行任务
可以自动调用工具、运行脚本、访问 API
可以持续运行而不是一次请求

示例能力：

自动整理邮件
自动监控网站
自动生成报告
自动执行代码

因此很多人称它为：

“数字员工框架” 或 “AI Agent 操作系统”。

2. OpenClaw 的主要技术创新点

OpenClaw 的创新不在单一技术，而在 系统架构整合。

核心能力包括：

2.1 Agent Runtime（持续运行的 AI）

传统 LLM：

1请求 → 回复 → 结束

OpenClaw：

1任务
2 ↓
3思考
4 ↓
5调用工具
6 ↓
7继续思考
8 ↓
9任务完成

即 长期运行的 AI Agent 进程。

2.2 工具调用系统（Tool / Skills）

AI 可以调用外部工具：

示例：

Web Search
文件系统
浏览器自动化
Python 执行
API 调用

AI 根据任务自动选择工具。

2.3 Memory 系统

OpenClaw通常提供三类记忆：

短期记忆（当前任务）
长期记忆（历史信息）
向量记忆（RAG检索）

常见存储：

向量数据库
SQL
文件系统

2.4 多模型路由

支持多个大模型：

OpenAI
Anthropic
Google
本地模型（Ollama）

不同任务可选择不同模型。

3. OpenClaw 源码级架构

接近真实代码结构：

 1openclaw/
 2├── cmd/            # CLI入口
 3├── gateway/        # 消息网关
 4├── agents/         # agent运行逻辑
 5├── providers/      # 模型适配
 6├── channels/       # 外部平台接入
 7├── tools/          # 工具系统
 8├── memory/         # AI记忆
 9├── storage/        # 数据存储
10└── sdk/            # 扩展接口

核心模块说明：

CLI

系统启动与管理：

1openclaw start
2openclaw agent create

Gateway

核心控制平面：

负责：

API
WebSocket
消息路由
agent调度

Agent Runtime

系统核心逻辑：

包含：

1Planner
2Executor
3Context Manager

执行循环：

1任务输入
2→ LLM 推理
3→ 选择工具
4→ 执行工具
5→ 返回结果
6→ 下一步推理

Tool Manager

管理所有工具：

例如：

1web_search
2browser
3filesystem
4python_exec

LLM Router

统一调用不同模型：

1写代码 → Claude
2总结 → GPT
3简单任务 → 本地模型

4. OpenClaw 权限模型是否类似 RBAC

OpenClaw 的设计 表面类似 RBAC，但本质不同。

RBAC 模型

1User → Role → Permission → Resource

OpenClaw 模型

1Agent → Capability → Tool → Resource

对应关系：

RBAC	OpenClaw
User	Agent
Role	Agent配置
Permission	Capability
Resource	Tool

但区别是：

RBAC 是 静态权限系统

OpenClaw 是 动态决策系统。

AI 会在运行时选择：

1思考 → 选择tool → 执行

因此更接近：

Capability-based security

5. Edict 项目（OpenClaw实现）的意义

Edict 是一个基于 OpenClaw 的 多 Agent 协作实验。

设计灵感来自中国古代：

三省六部制

系统结构：

 1用户
 2 ↓
 3太子（消息分拣）
 4 ↓
 5中书省（规划）
 6 ↓
 7门下省（审核）
 8 ↓
 9尚书省（调度）
10 ↓
11六部（执行）

Edict 的价值

1. Multi-Agent 组织结构探索

不同框架协作方式：

框架	协作模式
AutoGen	对话
CrewAI	pipeline
LangGraph	DAG
Edict	官僚流程

2. 引入治理层

增加：

1Planner
2 ↓
3Reviewer
4 ↓
5Executor

减少错误规划。

3. 可观测性

提供 dashboard：

agent 状态
任务流程
日志

Edict 的局限

agent 数量过多
本质仍是 workflow
很多逻辑依赖 prompt

因此更像：

多 agent 架构实验。

6. 大模型发展是否进入“复杂度换性能阶段”

部分是的，但不是全部。

目前能力增长主要来自三类计算：

1训练计算
2+
3推理计算
4+
5系统架构

6.1 Scaling（模型规模）

通过增加：

参数量
数据量
训练计算

提升能力。

6.2 推理计算（test-time compute）

推理时增加思考：

例如：

1chain-of-thought
2tree-of-thought
3self-consistency

用时间换准确度。

6.3 系统增强

能力来自：

1LLM
2 + RAG
3 + Tools
4 + Memory
5 + Agents

7. 为什么感觉 AI 进展变慢

原因：

1. 训练成本爆炸

1GPT-3  ≈ 几千万美元
2GPT-4  ≈ 数亿美元
3未来模型可能 >10亿美元

2. benchmark 接近饱和

很多测试：

MMLU
GSM8K
coding benchmark

已接近人类水平。

3. 推理能力瓶颈

LLM仍然弱于：

长链推理
复杂规划
世界模型

8. 未来可能的突破方向

研究界主要探索：

1. 继续 Scaling

更大模型。

2. 推理计算

推理时增加计算。

3. 新架构

可能替代 Transformer。

例如：

State Space Models
Mixture of Experts
Modular networks

4. AI 系统化

能力来自系统：

1LLM
2 + Agent
3 + Tool
4 + Memory

OpenClaw 属于这一方向。

总结

OpenClaw 的核心意义在于：

将 LLM 从“对话模型”变为“可执行任务的 AI 系统”。

它通过：

Agent Runtime
Tool System
Memory
多模型路由

构建了一个 AI Agent 运行环境。

而当前 AI 发展阶段：

既有 算力扩展，也在探索 新架构与系统化 AI。