OpenClaw

OpenClaw 与当前大模型发展阶段讨论总结

OpenClaw 最近在 AI 社区受到关注,主要原因是它将 AI 从“对话工具”扩展为“可执行任务的智能体系统”。

核心变化:

  • 从 Chatbot → Agent
  • AI 不只是回答问题,而是可以执行任务
  • 可以自动调用工具、运行脚本、访问 API
  • 可以持续运行而不是一次请求

示例能力:

  • 自动整理邮件
  • 自动监控网站
  • 自动生成报告
  • 自动执行代码

因此很多人称它为:

“数字员工框架” 或 “AI Agent 操作系统”。


2. OpenClaw 的主要技术创新点

OpenClaw 的创新不在单一技术,而在 系统架构整合

核心能力包括:

传统 LLM:

1请求 → 回复 → 结束

OpenClaw:

1任务
23思考
45调用工具
67继续思考
89任务完成

长期运行的 AI Agent 进程


AI 可以调用外部工具:

示例:

  • Web Search
  • 文件系统
  • 浏览器自动化
  • Python 执行
  • API 调用

AI 根据任务自动选择工具。


OpenClaw通常提供三类记忆:

  1. 短期记忆(当前任务)
  2. 长期记忆(历史信息)
  3. 向量记忆(RAG检索)

常见存储:

  • 向量数据库
  • SQL
  • 文件系统

支持多个大模型:

  • OpenAI
  • Anthropic
  • Google
  • 本地模型(Ollama)

不同任务可选择不同模型。


3. OpenClaw 源码级架构

接近真实代码结构:

 1openclaw/
 2├── cmd/            # CLI入口
 3├── gateway/        # 消息网关
 4├── agents/         # agent运行逻辑
 5├── providers/      # 模型适配
 6├── channels/       # 外部平台接入
 7├── tools/          # 工具系统
 8├── memory/         # AI记忆
 9├── storage/        # 数据存储
10└── sdk/            # 扩展接口

核心模块说明:

系统启动与管理:

1openclaw start
2openclaw agent create

核心控制平面:

负责:

  • API
  • WebSocket
  • 消息路由
  • agent调度

系统核心逻辑:

包含:

1Planner
2Executor
3Context Manager

执行循环:

1任务输入
2→ LLM 推理
3→ 选择工具
4→ 执行工具
5→ 返回结果
6→ 下一步推理

管理所有工具:

例如:

1web_search
2browser
3filesystem
4python_exec

统一调用不同模型:

1写代码 → Claude
2总结 → GPT
3简单任务 → 本地模型

4. OpenClaw 权限模型是否类似 RBAC

OpenClaw 的设计 表面类似 RBAC,但本质不同

1User → Role → Permission → Resource
1Agent → Capability → Tool → Resource

对应关系:

RBACOpenClaw
UserAgent
RoleAgent配置
PermissionCapability
ResourceTool

但区别是:

RBAC 是 静态权限系统

OpenClaw 是 动态决策系统

AI 会在运行时选择:

1思考  选择tool  执行

因此更接近:

Capability-based security


5. Edict 项目(OpenClaw实现)的意义

Edict 是一个基于 OpenClaw 的 多 Agent 协作实验

设计灵感来自中国古代:

三省六部制

系统结构:

 1用户
 2 3太子(消息分拣)
 4 5中书省(规划)
 6 7门下省(审核)
 8 9尚书省(调度)
1011六部(执行)

不同框架协作方式:

框架协作模式
AutoGen对话
CrewAIpipeline
LangGraphDAG
Edict官僚流程

增加:

1Planner
23Reviewer
45Executor

减少错误规划。


提供 dashboard:

  • agent 状态
  • 任务流程
  • 日志

  1. agent 数量过多
  2. 本质仍是 workflow
  3. 很多逻辑依赖 prompt

因此更像:

多 agent 架构实验。


6. 大模型发展是否进入“复杂度换性能阶段”

部分是的,但不是全部。

目前能力增长主要来自三类计算:

1训练计算
2+
3推理计算
4+
5系统架构

通过增加:

  • 参数量
  • 数据量
  • 训练计算

提升能力。


推理时增加思考:

例如:

1chain-of-thought
2tree-of-thought
3self-consistency

用时间换准确度。


能力来自:

1LLM
2 + RAG
3 + Tools
4 + Memory
5 + Agents

7. 为什么感觉 AI 进展变慢

原因:

1GPT-3  ≈ 几千万美元
2GPT-4  ≈ 数亿美元
3未来模型可能 >10亿美元

很多测试:

  • MMLU
  • GSM8K
  • coding benchmark

已接近人类水平。


LLM仍然弱于:

  • 长链推理
  • 复杂规划
  • 世界模型

8. 未来可能的突破方向

研究界主要探索:

更大模型。


推理时增加计算。


可能替代 Transformer。

例如:

  • State Space Models
  • Mixture of Experts
  • Modular networks

能力来自系统:

1LLM
2 + Agent
3 + Tool
4 + Memory

OpenClaw 属于这一方向。


总结

OpenClaw 的核心意义在于:

将 LLM 从“对话模型”变为“可执行任务的 AI 系统”。

它通过:

  • Agent Runtime
  • Tool System
  • Memory
  • 多模型路由

构建了一个 AI Agent 运行环境

而当前 AI 发展阶段:

既有 算力扩展,也在探索 新架构与系统化 AI