这款开源插件,号称解决了openclaw和hermes的金鱼记忆问题!
一、痛点:Agent 的”金鱼记忆”
你让 AI Agent 帮你看一份文档、写一段代码、查个资料,它回答得头头是道。但半小时后,当同一批上下文出现在新 session 里——之前的判断、中间结论、偏好取舍,一概清零。
这就是 Agent 的”金鱼记忆”:当前 session 内的上下文窗口再长,session 一关,一切归零。
传统应对手段是”上下文拉满”——把所有历史塞进 System Prompt。问题是:
- Token 成本线性增长
- 噪音越积越多,信号越压越弱
- 可读性归零:十万字日志,谁看得懂
问题的核心不是”存不下来”,而是”存了之后找不到、用不了、还贵”。
二、核心理念:分层 + 符号化
我们的方案不追求”全量存”,而是做两件事:
- 分层:按价值密度将记忆分成 L0–L3 四层,低层密集检索、高层语义抽象
- 符号化:用 Mermaid 图、关系表、语义标签替代自然语言日志,让机器快检索、让人一眼可读
这和传统向量方案的差异很清晰:
| 维度 | 传统向量方案 | 分层符号化 |
|---|---|---|
| 存储粒度 | chunk × N 条向量 | 4 层语义金字塔 |
| 检索方式 | 语义相似度 topK | 分层路由 + 符号匹配 |
| 可读性 | 天然不可读 | Mermaid / 表格 / 标签,人类友好 |
| 写入开销 | 每次对话全量向量化 | 按层增量更新 |
| 关键优势 | 无限弹性 | 可解释、可调试、成本可控 |
我们不丢弃向量检索,而是把它锁在 L1 做辅助检索;核心推理链路走符号结构。
三、符号化短期记忆:Mermaid 图谱替代万字日志
短期记忆发生在单次 session 内,容量有限但信息密度高。传统方式是逐轮记录自然语言,两小时 session 可以产出上万字。
我们改用 Mermaid 图谱 + 关系表 来记录:
- 已读文档 → 关键结论(一句话标签)
- 代码修改 → 改了什么、为什么改
- 判断取舍 → 选项 × 理由 × 决定
效果:同样的信息量,Token 消耗减少约 60%。
因为结构化的符号表达天然比自然语言紧凑,而且后续检索时可以直接按标签过滤,不需要语义匹配。
四、分层式长期记忆:L0 → L3 语义金字塔
1 | L3 领域知识 ← 顶层精炼,一句话 + 引用来源 |
L0 原始层:不主动查询,只在需要时回流到 L1。保证”有据可查”但不浪费检索预算。
L1 事实层:符号化日志,核心检索层。按主题分区,用 Mermaid 图 + 关系表表达。机器可索引,人可阅读。
L2 决策层:结构化决策记录。每次关键决策一张卡片:背景 → 选项 → 决定 → 结果。这是 Agent 真正”变聪明”的地方——不是记住更多事实,而是记住决策质量。
L3 领域层:精炼到极致。一句话或一个标签概括整个领域的关键认知。跨 session 检索时优先命中 L3,成本最低、准确率最高。
分层路由逻辑:查询先命中 L3,命中则直接返回;否则下沉到 L2/L1/L0 逐层扩展。
五、实测数据:Token −61%,通过率 +51%
在真实任务集上的对比(同等硬件、同等 session 预算约束):
| 指标 | 全量上下文 | 分层符号化 |
|---|---|---|
| 平均 Token 消耗 | 100% | −61% |
| 多步推理任务通过率 | baseline | +51% |
| 单次检索耗时 | — | −70% |
| 记忆写入开销 | 高(全量向量化) | 低(增量符号化) |
Token 下降来自三方面:符号压缩、分层路由、去噪。通过率提升来自两件事:记忆写入开销更低 → Agent 愿意写更多 → 记忆密度更高;信号更强 → 检索召回更准。
六、快速上手
OpenClaw 插件安装
1 | openclaw plugin install openclaw/memory-core |
Docker 部署
1 | version: "3" |
启动后,Agent 会自动检测到 memory-core 服务并开始写入记忆。零配置接入。
七、调参指南
五个关键参数,多数场景默认值即可,特殊场景可调:
| 参数 | 默认值 | 何时调大 | 何时调小 |
|---|---|---|---|
| L0→L1 回流阈值 | 0.7 相似度 | 高精度场景 | 低存储成本场景 |
| L1→L2 升级触发 | 连续命中 3 次 | 决策密集任务 | 轻量会话 |
| L3 精炼频率 | 每 50 次查询 | 长期运行 Agent | 短期项目 |
| 符号化压缩比 | 0.6 | 极度 Token 敏感 | 信息完整优先 |
| 检索深度 | L1+L2 | 复杂推理 | 简单查询 |
黄金法则:先让默认值跑一周,看 L1 日志的符号化质量,再决定是否调参。
八、白盒调试:可读中间产物的设计亮点
这是整个方案最被低估的优势。
传统记忆方案是黑盒:向量存在数据库里,每次检索的结果只能靠人工验证”准不准”。分层符号化方案从 L1 开始,每一个记忆单元都是人类可读的:
- L1 日志 = Mermaid 图 + 关系表,你在浏览器里直接打开就能看
- L2 决策卡 = 结构化卡片,每条决策的上下文和理由一目了然
- L3 领域摘要 = 每个领域一句话,可以逐层下钻追溯来源
这不仅仅是”可解释性”——当 Agent 的记忆出了问题,你知道是哪个节点错了,而不是对着一个黑盒向量库发呆。
九、Roadmap 与总结
当前阶段:分层符号化记忆架构已在 OpenClaw 中落地,L0–L3 四层 + Mermaid 符号化 + 分层路由。
下一步:
- L3 自动精炼:用轻量 LLM 自动从 L2 决策中提取领域认知
- 跨 Agent 记忆共享:多个 Agent 实例共享 L2/L3 层
- 记忆质量评估框架:自动评估记忆写入的准确性和检索召回率
写在最后:
Agent 记忆问题的解法从来不是”存更多”,而是”存得更聪明”。分层给了你成本控制能力,符号化给了你可读性和可调试性。两者结合,才是让 Agent 真正拥有”持续学习”能力的起点。











