MemPalace:本地优先的 AI 记忆系统,零 API 调用实现 96.6% 检索召回率

MemPalace:本地优先的AI记忆系统,零API调用实现96.6%检索召回率

GitHub 51,932 stars,Python,开源免费。本地优先的 AI 记忆系统,零 API 调用实现 96.6% 检索召回率,支持 Claude Code 集成,知识图谱+MCP Server 全生态覆盖。

前言:为什么AI助手总是"失忆"?

用过 Claude Code 或 Cursor 的开发者,一定遇到过这个痛点:AI 能记住当前项目的上下文,但只要你关闭会话,30天后它就彻底忘了你们讨论过的技术选型、踩过的坑、一起做的决策。

市面上的解决方案——Mem0、Mastra、Supermemory、Zep——要么是云服务(数据必须上传),要么依赖 LLM 做摘要(会丢失细节)。直到我发现了 MemPalace,一个本地优先的 AI 记忆系统,它的核心哲学是:原文存储,不做任何摘要,并且在 LongMemEval 基准上实现了 96.6% 的原始检索召回率,全程不需要调用任何 LLM API。


一、MemPalace 是什么?

MemPalace 是一个本地运行的 AI 记忆系统,本质上是一个语义检索引擎,专门用来存储和检索 AI 对话历史。

它的核心设计思想来自"记忆宫殿"——人类利用空间位置来增强记忆的方法。在 MemPalace 中,你的记忆被组织成:

核心技术特点

原文存储,不做摘要:这是 MemPalace 与其他方案最核心的区别。Mem0 等系统会把对话压缩成摘要来存储,好处是节省 token,坏处是不可逆地丢失细节。MemPalace 存的是完整的原始文本,通过语义向量搜索来检索。

本地优先,数据不出机器:所有内容默认存在本地,默认使用 ChromaDB 作为向量数据库后端。你也可以接入 Pinecone 等云端向量数据库,但默认情况下——你的对话数据永远不会离开你的电脑。

插拔式后端:向量数据库是插拔的。后端接口定义在 mempalace/backends/base.py,你可以自己实现一个后端接入任何向量数据库。

零 LLM 依赖的检索:核心检索完全靠向量相似度,不需要 LLM。96.6% R@5 的成绩是在零 LLM 调用下实现的。


二、安装与快速上手

# 安装(推荐 uv)
uv tool install mempalace

# 初始化记忆宫殿
mempalace init ~/projects/myapp

# 挖掘 Claude Code 会话历史
mempalace mine ~/.claude/projects/ --mode convos --wing myapp

# 语义搜索记忆
mempalace search "为什么我们选择了GraphQL"

# Claude Code 集成(自动保存会话)
mempalace install-claude-code

三、基准测试成绩

模式 R@5 是否需要LLM
Raw(纯向量搜索) 96.6% 不需要
Hybrid v4 98.4% 不需要
Hybrid v4 + LLM重排 ≥99% 任意LLM

四、知识图谱与 MCP Server

MemPalace 提供时序实体关系图谱(SQLite 本地存储)和 MCP Server(29 个工具),覆盖记忆读写、知识图谱管理、Wing/Room/Drawer 操作、Agent 日志记录。


五、适用场景

适合:长期项目的技术债务追溯、多角色协作的记忆共享、隐私敏感场景(医疗、法律、金融)。

不适合:需要 LLM 理解记忆内容的场景、超大规模记忆库(>100万条)、需要多设备同步。


六、避坑指南


七、总结

MemPalace 是一个设计思路非常清晰的 AI 记忆系统:不摘要、本地优先、零 LLM 依赖、96.6% R@5、可扩展+MCP Server 生态完整。

GitHub:https://github.com/MemPalace/mempalace 官方文档:https://mempalaceofficial.com

注意防伪:唯一官方来源是 GitHub 仓库、PyPI 包和 mempalaceofficial.com 域名。任何其他域名均为仿冒。

/*]]>*/