一、痛点:Agent 的”金鱼记忆”

你让 AI Agent 帮你看一份文档、写一段代码、查个资料,它回答得头头是道。但半小时后,当同一批上下文出现在新 session 里——之前的判断、中间结论、偏好取舍,一概清零。

这就是 Agent 的”金鱼记忆”:当前 session 内的上下文窗口再长,session 一关,一切归零。

传统应对手段是”上下文拉满”——把所有历史塞进 System Prompt。问题是:

  • Token 成本线性增长
  • 噪音越积越多,信号越压越弱
  • 可读性归零:十万字日志,谁看得懂

问题的核心不是”存不下来”,而是”存了之后找不到、用不了、还贵”。

二、核心理念:分层 + 符号化

我们的方案不追求”全量存”,而是做两件事:

  1. 分层:按价值密度将记忆分成 L0–L3 四层,低层密集检索、高层语义抽象
  2. 符号化:用 Mermaid 图、关系表、语义标签替代自然语言日志,让机器快检索、让人一眼可读

这和传统向量方案的差异很清晰:

维度 传统向量方案 分层符号化
存储粒度 chunk × N 条向量 4 层语义金字塔
检索方式 语义相似度 topK 分层路由 + 符号匹配
可读性 天然不可读 Mermaid / 表格 / 标签,人类友好
写入开销 每次对话全量向量化 按层增量更新
关键优势 无限弹性 可解释、可调试、成本可控

我们不丢弃向量检索,而是把它锁在 L1 做辅助检索;核心推理链路走符号结构。

三、符号化短期记忆:Mermaid 图谱替代万字日志

短期记忆发生在单次 session 内,容量有限但信息密度高。传统方式是逐轮记录自然语言,两小时 session 可以产出上万字。

我们改用 Mermaid 图谱 + 关系表 来记录:

  • 已读文档 → 关键结论(一句话标签)
  • 代码修改 → 改了什么、为什么改
  • 判断取舍 → 选项 × 理由 × 决定

效果:同样的信息量,Token 消耗减少约 60%。

因为结构化的符号表达天然比自然语言紧凑,而且后续检索时可以直接按标签过滤,不需要语义匹配。

四、分层式长期记忆:L0 → L3 语义金字塔

1
2
3
4
L3 领域知识   ← 顶层精炼,一句话 + 引用来源
L2 决策记录 ← 做了什么决定、什么时候、结果如何
L1 事实日志 ← 发生了什么事,原始符号化记录
L0 原始数据 ← 完整对话 / 文件 / 检索结果,按需回流

L0 原始层:不主动查询,只在需要时回流到 L1。保证”有据可查”但不浪费检索预算。

L1 事实层:符号化日志,核心检索层。按主题分区,用 Mermaid 图 + 关系表表达。机器可索引,人可阅读。

L2 决策层:结构化决策记录。每次关键决策一张卡片:背景 → 选项 → 决定 → 结果。这是 Agent 真正”变聪明”的地方——不是记住更多事实,而是记住决策质量。

L3 领域层:精炼到极致。一句话或一个标签概括整个领域的关键认知。跨 session 检索时优先命中 L3,成本最低、准确率最高。

分层路由逻辑:查询先命中 L3,命中则直接返回;否则下沉到 L2/L1/L0 逐层扩展。

五、实测数据:Token −61%,通过率 +51%

在真实任务集上的对比(同等硬件、同等 session 预算约束):

指标 全量上下文 分层符号化
平均 Token 消耗 100% −61%
多步推理任务通过率 baseline +51%
单次检索耗时 −70%
记忆写入开销 高(全量向量化) 低(增量符号化)

Token 下降来自三方面:符号压缩、分层路由、去噪。通过率提升来自两件事:记忆写入开销更低 → Agent 愿意写更多 → 记忆密度更高;信号更强 → 检索召回更准。

六、快速上手

OpenClaw 插件安装

1
openclaw plugin install openclaw/memory-core

Docker 部署

1
2
3
4
5
6
7
8
version: "3"
services:
memory-core:
image: openclaw/memory-core:latest
ports:
- "8080:8080"
volumes:
- ./memory:/data

启动后,Agent 会自动检测到 memory-core 服务并开始写入记忆。零配置接入。

七、调参指南

五个关键参数,多数场景默认值即可,特殊场景可调:

参数 默认值 何时调大 何时调小
L0→L1 回流阈值 0.7 相似度 高精度场景 低存储成本场景
L1→L2 升级触发 连续命中 3 次 决策密集任务 轻量会话
L3 精炼频率 每 50 次查询 长期运行 Agent 短期项目
符号化压缩比 0.6 极度 Token 敏感 信息完整优先
检索深度 L1+L2 复杂推理 简单查询

黄金法则:先让默认值跑一周,看 L1 日志的符号化质量,再决定是否调参。

八、白盒调试:可读中间产物的设计亮点

这是整个方案最被低估的优势。

传统记忆方案是黑盒:向量存在数据库里,每次检索的结果只能靠人工验证”准不准”。分层符号化方案从 L1 开始,每一个记忆单元都是人类可读的:

  • L1 日志 = Mermaid 图 + 关系表,你在浏览器里直接打开就能看
  • L2 决策卡 = 结构化卡片,每条决策的上下文和理由一目了然
  • L3 领域摘要 = 每个领域一句话,可以逐层下钻追溯来源

这不仅仅是”可解释性”——当 Agent 的记忆出了问题,你知道是哪个节点错了,而不是对着一个黑盒向量库发呆。

九、Roadmap 与总结

当前阶段:分层符号化记忆架构已在 OpenClaw 中落地,L0–L3 四层 + Mermaid 符号化 + 分层路由。

下一步

  • L3 自动精炼:用轻量 LLM 自动从 L2 决策中提取领域认知
  • 跨 Agent 记忆共享:多个 Agent 实例共享 L2/L3 层
  • 记忆质量评估框架:自动评估记忆写入的准确性和检索召回率

写在最后

Agent 记忆问题的解法从来不是”存更多”,而是”存得更聪明”。分层给了你成本控制能力,符号化给了你可读性和可调试性。两者结合,才是让 Agent 真正拥有”持续学习”能力的起点。