AI Agent 记忆层对比：mem0 vs 腾讯 AGENT 记忆插件

摘要：AI Agent 的记忆能力正在从”上下文拼凑”走向”独立记忆层”。本文对比 mem0 与腾讯 AGENT 记忆插件在架构、存储、检索、集成方式上的核心差异，帮你为项目选型。

一、背景：为什么 Agent 需要记忆层？

在长程任务、多轮对话、跨会话交互中，Agent 面临着同一个痛点：上下文窗口有限，但历史信息无限增长。

传统的做法是把所有历史塞进 prompt，结果：

Token 爆炸，成本飙升
关键信息被截断或遗忘
无法区分”短期任务状态”和”长期用户偏好”

于是”记忆层”（Memory Layer）成为独立赛道。Agent 运行时会调用外部记忆系统，在对话之外存储、蒸馏、召回经验。

目前开源社区中最受关注的两套方案是：

项目	定位	Star 数	协议
mem0	通用记忆层，多 Agent 框架适配	59K+	Apache 2.0
TencentDB Agent Memory	分层符号化记忆，深度绑定 OpenClaw/Hermes	6K+	MIT

下面逐一拆解。

二、mem0：通用型记忆底座

GitHub: https://github.com/mem0ai/mem0
论文: Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory（arXiv:2504.19413）

2.1 核心设计

mem0 把自己定位为 “Universal Memory Layer for AI Agents”——不绑定特定框架，而是提供 SDK/API，让任何 Agent 都能挂上记忆。

最新算法（2026 年 4 月发布）的评测数据：

Benchmark	旧算法	新算法	Token 消耗	p50 延迟
LoCoMo	71.4	91.6	7.0K	0.88s
LongMemEval	67.8	94.8	6.8K	1.09s
BEAM (1M)	—	64.1	6.7K	1.00s
BEAM (10M)	—	48.6	6.9K	1.05s

2.2 技术特点

ADD-only 单次提取：一次 LLM 调用完成记忆提取，不做 UPDATE/DELETE，记忆只增不减。
Agent 生成事实一等公民：Agent 确认过的操作结果与用户输入同等权重。
实体链接（Entity Linking）：提取实体并跨记忆关联，增强检索。
多信号融合检索：语义向量 + BM25 关键词 + 实体匹配并行打分后融合。
时间感知（Temporal Reasoning）：区分”当前状态””历史事件””未来计划”，召回对应时间窗口的记忆。

2.3 存储与部署

存储：支持本地 SQLite/向量库（Qdrant 等），也有云端托管平台 app.mem0.ai。
Embedding：默认 text-embedding-3-small，推荐 Qwen2-1.5B-Instruct 等开源模型。
SDK：Python / Node.js，CLI 工具 mem0-cli。
生态：LangChain、CrewAI、LangGraph、ChatGPT 插件、Chrome 浏览器扩展。

2.4 适用场景

客服机器人、个人 AI 助手、医疗健康、生产力工具——任何需要”记住用户偏好和历史”的通用场景。

三、腾讯 AGENT 记忆插件：分层符号化架构

GitHub: https://github.com/TencentCloud/TencentDB-Agent-Memory
版本: 0.3.6
官网: https://github.com/TencentCloud/TencentDB-Agent-Memory

3.1 核心理念

“Memory is not about hoarding everything in the AI — it is about sparing humans from having to repeat themselves.”

腾讯团队的解法是 “符号化短期记忆 + 分层长期记忆”：

短期记忆：把厚重的工具日志卸载到文件系统，只把轻量级 Mermaid 符号图谱注入上下文，节省 Token 的同时保留完整回溯路径。
长期记忆：建立 L0 → L1 → L2 → L3 的语义金字塔，从原始对话逐层蒸馏为用户画像。

3.2 四层金字塔

层级	名称	内容	存储形式
L0	Conversation	原始对话	文本文件 / 数据库
L1	Atom	结构化事实	向量 + 关键词索引
L2	Scenario	场景块	Markdown
L3	Persona	用户画像	Markdown

3.3 符号化压缩（Context Offload）

在长任务中，最大 Token 消耗往往来自过程日志（搜索结果、代码、报错）。

腾讯方案的做法是：

完整工具日志写入外部文件 refs/*.md
用 Mermaid 语法生成任务状态图谱，每个节点带 node_id
Agent 上下文只保留图谱（几百 Token）
需要细节时，通过 node_id 瞬间回溯原始文本

效果：接入 OpenClaw 后，Token 消耗最高降低 61.38%，通过率相对提升 51.52%；PersonaMem 准确率从 48% 提升到 76%。

3.4 存储与部署

存储：SQLite + sqlite-vec 本地优先，也支持腾讯云向量数据库（TCVDB）。
异构存储：底层（事实/日志）存数据库，上层（画像/场景/画布）存 Markdown 文件。
运行时：OpenClaw 插件 / Hermes Gateway（HTTP sidecar）。
检索：BM25 + 向量 + RRF（Reciprocal Rank Fusion）混合检索，支持中文 jieba 分词。

四、核心差异对比

4.1 架构哲学

维度	mem0	腾讯 AGENT 记忆插件
设计目标	通用记忆底座，框架无关	深度集成 OpenClaw/Hermes，重 Token 效率
记忆形态	扁平记忆列表，多信号融合检索	分层金字塔（L0→L3），上层结构 + 下层证据
短期压缩	单次提取 ~7K tokens	符号化 Mermaid 图谱，上下文仅几百 tokens
更新策略	ADD-only，记忆累积不覆盖	分层蒸馏，L0→L1→L2→L3 渐进式抽象
可解释性	向量评分，黑盒程度较高	白盒调试，Markdown/Mermaid 可读，可逐层下钻
数据所有权	云端托管 + 自托管可选	本地优先，零外部 API 依赖

4.2 技术栈对比

维度	mem0	腾讯 AGENT 记忆插件
语言	Python + Node.js	TypeScript / Node.js
存储	Qdrant、SQLite、云端托管	SQLite + sqlite-vec（本地）/ TCVDB（云端）
Embedding	多模型支持，默认 OpenAI	可配置，支持 BGE-M3 等开源模型
检索	语义 + BM25 + 实体链接 + 时间感知	BM25 + 向量 + RRF 融合，支持中文
部署形态	SDK、CLI、Docker、云端平台	OpenClaw 插件、Hermes Gateway、Docker

4.3 集成生态对比

维度	mem0	腾讯 AGENT 记忆插件
目标框架	LangChain、CrewAI、LangGraph、ChatGPT、Claude Code 等	OpenClaw、Hermes（深度绑定）
平台化	有独立云平台 app.mem0.ai，提供托管 API Key	无独立云平台，强调本地部署
扩展性	高，通用 SDK	中，面向特定生态深度优化
多语言	全球社区，英文文档为主	中英双语，中文社区活跃（微信/Discord）

4.4 Token 效率对比

维度	mem0	腾讯 AGENT 记忆插件
单次检索 Token	~7K（新算法）	长期记忆检索可控，短期压缩后可低至几百 Token
上下文压缩	无专用符号化压缩	Mermaid 图谱 + 上下文卸载，节省 61%+
延迟	p50 ≈ 1s	5s 超时兜底，避免阻塞对话

五、选型建议

选 mem0 如果你需要：

在 多个框架（LangChain、CrewAI 等）之间复用同一套记忆
快速原型验证，不想绑定特定 Agent 平台
需要云端托管，不想自己运维向量数据库
团队有 Python 背景，偏好 SDK 直接调用

选腾讯 AGENT 记忆插件如果你需要：

深度使用 OpenClaw 或 Hermes，希望记忆能力原生融入
长程任务对 Token 成本极度敏感，需要上下文卸载
需要白盒调试，愿意阅读 Markdown/Mermaid 记忆文件
优先本地部署，数据不出境，零外部 API 依赖
中文场景为主，需要原生中文分词（jieba）和中文社区支持

六、总结

特性	mem0	腾讯 AGENT 记忆插件
Star 数	59K+	6K+
定位	通用记忆底座	分层符号化记忆系统
架构	扁平记忆 + 多信号检索	L0→L3 金字塔 + Mermaid 符号压缩
框架绑定	轻，框架无关	重，OpenClaw/Hermes 深度集成
Token 效率	中（~7K/次）	高（压缩后几百 tokens）
可解释性	向量黑盒	白盒，Markdown/Mermaid 可读
部署	SDK / 云端 / 自托管	本地优先（SQLite） / 腾讯云
最佳场景	多框架、快速集成	长程 Agent、OpenClaw/Hermes 生态