MemPalace:本地优先的AI记忆系统,零API调用实现96.6%检索召回率
用过 Claude Code 或 Cursor 的开发者,一定遇到过这个痛点:AI 能记住当前项目的上下文,但只要你关闭会话,30天后它就彻底忘了你们讨论过的技术选型、踩过的坑、一起做的决策。
市面上的解决方案——Mem0、Mastra、Supermemory、Zep——要么是云服务,要么依赖 LLM 做摘要。直到 MemPalace,本地优先,零 API 调用,在 LongMemEval 基准上实现了 96.6% 的原始检索召回率。
GitHub:51,932 stars,Python,开源免费。
一、MemPalace 是什么?
MemPalace 是一个本地运行的 AI 记忆系统,本质上是一个语义检索引擎,专门用来存储和检索 AI 对话历史。
它的核心设计思想来自"记忆宫殿"——人类利用空间位置来增强记忆的方法。在 MemPalace 中,你的记忆被组织成:
- Wing(翅膀):按人物或项目隔离记忆
- Room(房间):按主题或话题分类
- Drawer(抽屉):存储原始内容片段
二、核心技术特点
原文存储,不做摘要:MemPalace 存的是完整的原始文本,通过语义向量搜索来检索。
本地优先,数据不出机器:所有内容默认存在本地,默认使用 ChromaDB 作为向量数据库后端。
插拔式后端:向量数据库是插拔的,后端接口定义在 mempalace/backends/base.py。
零 LLM 依赖的检索:核心检索完全靠向量相似度,不需要 LLM。96.6% R@5 的成绩是在零 LLM 调用下实现的。
三、基准测试成绩
LongMemEval(主要基准,500问题):Raw模式 96.6% R@5(无需LLM);Hybrid v4 98.4% R@5(无需LLM);Hybrid v4+LLM重排 >=99%。
其他基准:LoCoMo Hybrid v5达到88.9% R@10;ConvoMem平均召回92.9%;MemBench达到80.3% R@5。
四、知识图谱与 MCP Server
MemPalace 还包含一个时序实体关系图谱,支持添加实体和关系、时序窗口、时间线查询、失效处理。
MCP Server 提供 29 个工具,覆盖记忆读写、知识图谱、Wing/Room/Drawer管理、Agent日志等。
五、适用场景
适合:长期项目的技术债务追溯、多角色协作的记忆共享、隐私敏感场景。
不适合:需要 LLM 理解记忆内容的场景、超大规模记忆库(>100万条)、需要多设备同步。
六、避坑指南
uv 版本过旧导致安装失败:升级 uv(uv self update)或用 pip install mempalace。
首次初始化网络超时:设置代理 export https_proxy=http://your-proxy:port 后重试。
会话过期丢记忆:安装 Claude Code 钩子(mempalace install-claude-code),自动保存。
七、总结
MemPalace 是一个设计思路非常清晰的 AI 记忆系统:不摘要、原文存储;本地优先、数据不出机器;零 LLM 依赖、96.6% R@5;可扩展、插拔后端+MCP Server生态完整。
GitHub:https://github.com/MemPalace/mempalace | 官方文档:https://mempalaceofficial.com