AI Agent 记忆层对比:mem0 vs 腾讯 AGENT 记忆插件
摘要:AI Agent 的记忆能力正在从”上下文拼凑”走向”独立记忆层”。本文对比 mem0 与腾讯 AGENT 记忆插件在架构、存储、检索、集成方式上的核心差异,帮你为项目选型。
一、背景:为什么 Agent 需要记忆层?
在长程任务、多轮对话、跨会话交互中,Agent 面临着同一个痛点:上下文窗口有限,但历史信息无限增长。
传统的做法是把所有历史塞进 prompt,结果:
- Token 爆炸,成本飙升
- 关键信息被截断或遗忘
- 无法区分”短期任务状态”和”长期用户偏好”
于是”记忆层”(Memory Layer)成为独立赛道。Agent 运行时会调用外部记忆系统,在对话之外存储、蒸馏、召回经验。
目前开源社区中最受关注的两套方案是:
| 项目 | 定位 | Star 数 | 协议 |
|---|---|---|---|
| mem0 | 通用记忆层,多 Agent 框架适配 | 59K+ | Apache 2.0 |
| TencentDB Agent Memory | 分层符号化记忆,深度绑定 OpenClaw/Hermes | 6K+ | MIT |
下面逐一拆解。
二、mem0:通用型记忆底座
GitHub: https://github.com/mem0ai/mem0
论文: Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory(arXiv:2504.19413)
2.1 核心设计
mem0 把自己定位为 “Universal Memory Layer for AI Agents”——不绑定特定框架,而是提供 SDK/API,让任何 Agent 都能挂上记忆。
最新算法(2026 年 4 月发布)的评测数据:
| Benchmark | 旧算法 | 新算法 | Token 消耗 | p50 延迟 |
|---|---|---|---|---|
| LoCoMo | 71.4 | 91.6 | 7.0K | 0.88s |
| LongMemEval | 67.8 | 94.8 | 6.8K | 1.09s |
| BEAM (1M) | — | 64.1 | 6.7K | 1.00s |
| BEAM (10M) | — | 48.6 | 6.9K | 1.05s |
2.2 技术特点
- ADD-only 单次提取:一次 LLM 调用完成记忆提取,不做 UPDATE/DELETE,记忆只增不减。
- Agent 生成事实一等公民:Agent 确认过的操作结果与用户输入同等权重。
- 实体链接(Entity Linking):提取实体并跨记忆关联,增强检索。
- 多信号融合检索:语义向量 + BM25 关键词 + 实体匹配并行打分后融合。
- 时间感知(Temporal Reasoning):区分”当前状态””历史事件””未来计划”,召回对应时间窗口的记忆。
2.3 存储与部署
- 存储:支持本地 SQLite/向量库(Qdrant 等),也有云端托管平台 app.mem0.ai。
- Embedding:默认
text-embedding-3-small,推荐 Qwen2-1.5B-Instruct 等开源模型。 - SDK:Python / Node.js,CLI 工具
mem0-cli。 - 生态:LangChain、CrewAI、LangGraph、ChatGPT 插件、Chrome 浏览器扩展。
2.4 适用场景
客服机器人、个人 AI 助手、医疗健康、生产力工具——任何需要”记住用户偏好和历史”的通用场景。
三、腾讯 AGENT 记忆插件:分层符号化架构
GitHub: https://github.com/TencentCloud/TencentDB-Agent-Memory
版本: 0.3.6
官网: https://github.com/TencentCloud/TencentDB-Agent-Memory
3.1 核心理念
“Memory is not about hoarding everything in the AI — it is about sparing humans from having to repeat themselves.”
腾讯团队的解法是 “符号化短期记忆 + 分层长期记忆”:
- 短期记忆:把厚重的工具日志卸载到文件系统,只把轻量级 Mermaid 符号图谱注入上下文,节省 Token 的同时保留完整回溯路径。
- 长期记忆:建立 L0 → L1 → L2 → L3 的语义金字塔,从原始对话逐层蒸馏为用户画像。
3.2 四层金字塔
| 层级 | 名称 | 内容 | 存储形式 |
|---|---|---|---|
| L0 | Conversation | 原始对话 | 文本文件 / 数据库 |
| L1 | Atom | 结构化事实 | 向量 + 关键词索引 |
| L2 | Scenario | 场景块 | Markdown |
| L3 | Persona | 用户画像 | Markdown |
3.3 符号化压缩(Context Offload)
在长任务中,最大 Token 消耗往往来自过程日志(搜索结果、代码、报错)。
腾讯方案的做法是:
- 完整工具日志写入外部文件
refs/*.md - 用 Mermaid 语法生成任务状态图谱,每个节点带
node_id - Agent 上下文只保留图谱(几百 Token)
- 需要细节时,通过
node_id瞬间回溯原始文本
效果:接入 OpenClaw 后,Token 消耗最高降低 61.38%,通过率相对提升 51.52%;PersonaMem 准确率从 48% 提升到 76%。
3.4 存储与部署
- 存储:
SQLite + sqlite-vec本地优先,也支持腾讯云向量数据库(TCVDB)。 - 异构存储:底层(事实/日志)存数据库,上层(画像/场景/画布)存 Markdown 文件。
- 运行时:OpenClaw 插件 / Hermes Gateway(HTTP sidecar)。
- 检索:BM25 + 向量 + RRF(Reciprocal Rank Fusion)混合检索,支持中文 jieba 分词。
四、核心差异对比
4.1 架构哲学
| 维度 | mem0 | 腾讯 AGENT 记忆插件 |
|---|---|---|
| 设计目标 | 通用记忆底座,框架无关 | 深度集成 OpenClaw/Hermes,重 Token 效率 |
| 记忆形态 | 扁平记忆列表,多信号融合检索 | 分层金字塔(L0→L3),上层结构 + 下层证据 |
| 短期压缩 | 单次提取 ~7K tokens | 符号化 Mermaid 图谱,上下文仅几百 tokens |
| 更新策略 | ADD-only,记忆累积不覆盖 | 分层蒸馏,L0→L1→L2→L3 渐进式抽象 |
| 可解释性 | 向量评分,黑盒程度较高 | 白盒调试,Markdown/Mermaid 可读,可逐层下钻 |
| 数据所有权 | 云端托管 + 自托管可选 | 本地优先,零外部 API 依赖 |
4.2 技术栈对比
| 维度 | mem0 | 腾讯 AGENT 记忆插件 |
|---|---|---|
| 语言 | Python + Node.js | TypeScript / Node.js |
| 存储 | Qdrant、SQLite、云端托管 | SQLite + sqlite-vec(本地)/ TCVDB(云端) |
| Embedding | 多模型支持,默认 OpenAI | 可配置,支持 BGE-M3 等开源模型 |
| 检索 | 语义 + BM25 + 实体链接 + 时间感知 | BM25 + 向量 + RRF 融合,支持中文 |
| 部署形态 | SDK、CLI、Docker、云端平台 | OpenClaw 插件、Hermes Gateway、Docker |
4.3 集成生态对比
| 维度 | mem0 | 腾讯 AGENT 记忆插件 |
|---|---|---|
| 目标框架 | LangChain、CrewAI、LangGraph、ChatGPT、Claude Code 等 | OpenClaw、Hermes(深度绑定) |
| 平台化 | 有独立云平台 app.mem0.ai,提供托管 API Key | 无独立云平台,强调本地部署 |
| 扩展性 | 高,通用 SDK | 中,面向特定生态深度优化 |
| 多语言 | 全球社区,英文文档为主 | 中英双语,中文社区活跃(微信/Discord) |
4.4 Token 效率对比
| 维度 | mem0 | 腾讯 AGENT 记忆插件 |
|---|---|---|
| 单次检索 Token | ~7K(新算法) | 长期记忆检索可控,短期压缩后可低至几百 Token |
| 上下文压缩 | 无专用符号化压缩 | Mermaid 图谱 + 上下文卸载,节省 61%+ |
| 延迟 | p50 ≈ 1s | 5s 超时兜底,避免阻塞对话 |
五、选型建议
选 mem0 如果你需要:
- 在 多个框架(LangChain、CrewAI 等)之间复用同一套记忆
- 快速原型验证,不想绑定特定 Agent 平台
- 需要云端托管,不想自己运维向量数据库
- 团队有 Python 背景,偏好 SDK 直接调用
选腾讯 AGENT 记忆插件如果你需要:
- 深度使用 OpenClaw 或 Hermes,希望记忆能力原生融入
- 长程任务对 Token 成本极度敏感,需要上下文卸载
- 需要白盒调试,愿意阅读 Markdown/Mermaid 记忆文件
- 优先本地部署,数据不出境,零外部 API 依赖
- 中文场景为主,需要原生中文分词(jieba)和中文社区支持
六、总结
| 特性 | mem0 | 腾讯 AGENT 记忆插件 |
|---|---|---|
| Star 数 | 59K+ | 6K+ |
| 定位 | 通用记忆底座 | 分层符号化记忆系统 |
| 架构 | 扁平记忆 + 多信号检索 | L0→L3 金字塔 + Mermaid 符号压缩 |
| 框架绑定 | 轻,框架无关 | 重,OpenClaw/Hermes 深度集成 |
| Token 效率 | 中(~7K/次) | 高(压缩后几百 tokens) |
| 可解释性 | 向量黑盒 | 白盒,Markdown/Mermaid 可读 |
| 部署 | SDK / 云端 / 自托管 | 本地优先(SQLite) / 腾讯云 |
| 最佳场景 | 多框架、快速集成 | 长程 Agent、OpenClaw/Hermes 生态 |
两者并非互斥——mem0 胜在生态广、上手快,腾讯方案胜在Token 效率高、架构可解释。如果追求极致压缩和分层架构,腾讯 AGENT 记忆插件值得深入研究;如果追求跨框架通用和快速落地,mem0 仍是更稳妥的选择。
🤔 你怎么看:你更在意”通用框架兼容性”还是”极致 Token 效率”?欢迎在评论区讨论。
本文基于 GitHub 开源项目 README、arXiv 论文及公开技术文档整理,数据截至 2026 年 6 月。










