摘要:AI Agent 的记忆能力正在从”上下文拼凑”走向”独立记忆层”。本文对比 mem0 与腾讯 AGENT 记忆插件在架构、存储、检索、集成方式上的核心差异,帮你为项目选型。


一、背景:为什么 Agent 需要记忆层?

在长程任务、多轮对话、跨会话交互中,Agent 面临着同一个痛点:上下文窗口有限,但历史信息无限增长

传统的做法是把所有历史塞进 prompt,结果:

  • Token 爆炸,成本飙升
  • 关键信息被截断或遗忘
  • 无法区分”短期任务状态”和”长期用户偏好”

于是”记忆层”(Memory Layer)成为独立赛道。Agent 运行时会调用外部记忆系统,在对话之外存储、蒸馏、召回经验。

目前开源社区中最受关注的两套方案是:

项目 定位 Star 数 协议
mem0 通用记忆层,多 Agent 框架适配 59K+ Apache 2.0
TencentDB Agent Memory 分层符号化记忆,深度绑定 OpenClaw/Hermes 6K+ MIT

下面逐一拆解。


二、mem0:通用型记忆底座

GitHub: https://github.com/mem0ai/mem0
论文: Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory(arXiv:2504.19413)

2.1 核心设计

mem0 把自己定位为 “Universal Memory Layer for AI Agents”——不绑定特定框架,而是提供 SDK/API,让任何 Agent 都能挂上记忆。

最新算法(2026 年 4 月发布)的评测数据:

Benchmark 旧算法 新算法 Token 消耗 p50 延迟
LoCoMo 71.4 91.6 7.0K 0.88s
LongMemEval 67.8 94.8 6.8K 1.09s
BEAM (1M) 64.1 6.7K 1.00s
BEAM (10M) 48.6 6.9K 1.05s

2.2 技术特点

  1. ADD-only 单次提取:一次 LLM 调用完成记忆提取,不做 UPDATE/DELETE,记忆只增不减。
  2. Agent 生成事实一等公民:Agent 确认过的操作结果与用户输入同等权重。
  3. 实体链接(Entity Linking):提取实体并跨记忆关联,增强检索。
  4. 多信号融合检索:语义向量 + BM25 关键词 + 实体匹配并行打分后融合。
  5. 时间感知(Temporal Reasoning):区分”当前状态””历史事件””未来计划”,召回对应时间窗口的记忆。

2.3 存储与部署

  • 存储:支持本地 SQLite/向量库(Qdrant 等),也有云端托管平台 app.mem0.ai。
  • Embedding:默认 text-embedding-3-small,推荐 Qwen2-1.5B-Instruct 等开源模型。
  • SDK:Python / Node.js,CLI 工具 mem0-cli
  • 生态:LangChain、CrewAI、LangGraph、ChatGPT 插件、Chrome 浏览器扩展。

2.4 适用场景

客服机器人、个人 AI 助手、医疗健康、生产力工具——任何需要”记住用户偏好和历史”的通用场景。


三、腾讯 AGENT 记忆插件:分层符号化架构

GitHub: https://github.com/TencentCloud/TencentDB-Agent-Memory
版本: 0.3.6
官网: https://github.com/TencentCloud/TencentDB-Agent-Memory

3.1 核心理念

“Memory is not about hoarding everything in the AI — it is about sparing humans from having to repeat themselves.”

腾讯团队的解法是 “符号化短期记忆 + 分层长期记忆”

  • 短期记忆:把厚重的工具日志卸载到文件系统,只把轻量级 Mermaid 符号图谱注入上下文,节省 Token 的同时保留完整回溯路径。
  • 长期记忆:建立 L0 → L1 → L2 → L3 的语义金字塔,从原始对话逐层蒸馏为用户画像。

3.2 四层金字塔

层级 名称 内容 存储形式
L0 Conversation 原始对话 文本文件 / 数据库
L1 Atom 结构化事实 向量 + 关键词索引
L2 Scenario 场景块 Markdown
L3 Persona 用户画像 Markdown

3.3 符号化压缩(Context Offload)

在长任务中,最大 Token 消耗往往来自过程日志(搜索结果、代码、报错)。

腾讯方案的做法是:

  1. 完整工具日志写入外部文件 refs/*.md
  2. 用 Mermaid 语法生成任务状态图谱,每个节点带 node_id
  3. Agent 上下文只保留图谱(几百 Token)
  4. 需要细节时,通过 node_id 瞬间回溯原始文本

效果:接入 OpenClaw 后,Token 消耗最高降低 61.38%,通过率相对提升 51.52%;PersonaMem 准确率从 48% 提升到 76%

3.4 存储与部署

  • 存储SQLite + sqlite-vec 本地优先,也支持腾讯云向量数据库(TCVDB)。
  • 异构存储:底层(事实/日志)存数据库,上层(画像/场景/画布)存 Markdown 文件。
  • 运行时:OpenClaw 插件 / Hermes Gateway(HTTP sidecar)。
  • 检索:BM25 + 向量 + RRF(Reciprocal Rank Fusion)混合检索,支持中文 jieba 分词。

四、核心差异对比

4.1 架构哲学

维度 mem0 腾讯 AGENT 记忆插件
设计目标 通用记忆底座,框架无关 深度集成 OpenClaw/Hermes,重 Token 效率
记忆形态 扁平记忆列表,多信号融合检索 分层金字塔(L0→L3),上层结构 + 下层证据
短期压缩 单次提取 ~7K tokens 符号化 Mermaid 图谱,上下文仅几百 tokens
更新策略 ADD-only,记忆累积不覆盖 分层蒸馏,L0→L1→L2→L3 渐进式抽象
可解释性 向量评分,黑盒程度较高 白盒调试,Markdown/Mermaid 可读,可逐层下钻
数据所有权 云端托管 + 自托管可选 本地优先,零外部 API 依赖

4.2 技术栈对比

维度 mem0 腾讯 AGENT 记忆插件
语言 Python + Node.js TypeScript / Node.js
存储 Qdrant、SQLite、云端托管 SQLite + sqlite-vec(本地)/ TCVDB(云端)
Embedding 多模型支持,默认 OpenAI 可配置,支持 BGE-M3 等开源模型
检索 语义 + BM25 + 实体链接 + 时间感知 BM25 + 向量 + RRF 融合,支持中文
部署形态 SDK、CLI、Docker、云端平台 OpenClaw 插件、Hermes Gateway、Docker

4.3 集成生态对比

维度 mem0 腾讯 AGENT 记忆插件
目标框架 LangChain、CrewAI、LangGraph、ChatGPT、Claude Code 等 OpenClaw、Hermes(深度绑定)
平台化 有独立云平台 app.mem0.ai,提供托管 API Key 无独立云平台,强调本地部署
扩展性 高,通用 SDK 中,面向特定生态深度优化
多语言 全球社区,英文文档为主 中英双语,中文社区活跃(微信/Discord)

4.4 Token 效率对比

维度 mem0 腾讯 AGENT 记忆插件
单次检索 Token ~7K(新算法) 长期记忆检索可控,短期压缩后可低至几百 Token
上下文压缩 无专用符号化压缩 Mermaid 图谱 + 上下文卸载,节省 61%+
延迟 p50 ≈ 1s 5s 超时兜底,避免阻塞对话

五、选型建议

选 mem0 如果你需要:

  • 多个框架(LangChain、CrewAI 等)之间复用同一套记忆
  • 快速原型验证,不想绑定特定 Agent 平台
  • 需要云端托管,不想自己运维向量数据库
  • 团队有 Python 背景,偏好 SDK 直接调用

选腾讯 AGENT 记忆插件如果你需要:

  • 深度使用 OpenClaw 或 Hermes,希望记忆能力原生融入
  • 长程任务对 Token 成本极度敏感,需要上下文卸载
  • 需要白盒调试,愿意阅读 Markdown/Mermaid 记忆文件
  • 优先本地部署,数据不出境,零外部 API 依赖
  • 中文场景为主,需要原生中文分词(jieba)和中文社区支持

六、总结

特性 mem0 腾讯 AGENT 记忆插件
Star 数 59K+ 6K+
定位 通用记忆底座 分层符号化记忆系统
架构 扁平记忆 + 多信号检索 L0→L3 金字塔 + Mermaid 符号压缩
框架绑定 轻,框架无关 重,OpenClaw/Hermes 深度集成
Token 效率 中(~7K/次) 高(压缩后几百 tokens)
可解释性 向量黑盒 白盒,Markdown/Mermaid 可读
部署 SDK / 云端 / 自托管 本地优先(SQLite) / 腾讯云
最佳场景 多框架、快速集成 长程 Agent、OpenClaw/Hermes 生态

两者并非互斥——mem0 胜在生态广、上手快,腾讯方案胜在Token 效率高、架构可解释。如果追求极致压缩和分层架构,腾讯 AGENT 记忆插件值得深入研究;如果追求跨框架通用和快速落地,mem0 仍是更稳妥的选择。


🤔 你怎么看:你更在意”通用框架兼容性”还是”极致 Token 效率”?欢迎在评论区讨论。


本文基于 GitHub 开源项目 README、arXiv 论文及公开技术文档整理,数据截至 2026 年 6 月。