更新于 2026 年 5 月
Letta 是 MemGPT 的生产级演进,后者是 2023 年的研究论文,提出将 LLM 的上下文窗口视为 OS 中 RAM 的类比,并使用「记忆分页」将不太相关的事实换入换出。该框架在 Apache 2.0 下开源,为构建自主 AI 代理的工程团队设计——这些代理在没有人在回路中的情况下执行多步操作,跨会话维持状态,并需要推理自己的记忆。
Letta 的分层记忆有三层:核心记忆(始终在上下文中,由代理本身通过工具调用编辑)、存档记忆(可向量搜索,由代理查询)和召回记忆(完整对话历史)。定义性特质是自我管理:代理决定什么被提升到核心、什么被存档、什么被遗忘。还有 Letta Cloud(付费托管层)以及一个面向开发者的网页 UI,用于构建和测试代理。
Alma 是一个为终端用户和开发者打造的完整持久记忆产品。终端用户在 alma.olivares.ai 注册,与 Anthropic Claude(Haiku、Sonnet、带 1M tokens 上下文的 Opus 4.7)对话,记忆层自动捕获事实、偏好和决策。Soul Engine 处理身份。Image、Video、Music 和 Code 工作室打包在内。开发者也可以通过 Max 套餐的 MCP server、JavaScript SDK 和 REST API 访问同一记忆。
记忆结构化为三层(记忆 / 情景 / 流程),每层有类型,每层检索方式不同。付费套餐起价 $14/mo(Starter),带完整 Soul Engine 和无限记忆。
两者都有三层,但理念相反。Letta 的层级关于数据相对于上下文窗口的位置——core(始终在内)、archival(一次工具调用之外)、recall(全部历史)。代理使用内置工具在层级间移动数据。
Alma 的层级关于知识是什么类型——记忆(事实)、情景(事件)、流程(工作流)。每层都有自己的检索和生命周期规则。用户可以读、编辑、评分和删除任何层中的任何内容。上下文组装在每次聊天前将它们组合成系统提示——用户不必考虑这些,但可以查看一切。
控制轴最为重要。Letta 是代理托管的:LLM 本身就是策展人。这对自主代理强大,但更难预测——你的代理可能决定你的技术栈偏好不重要并将其存档。Alma 是用户控制的:重要性、置信度、类别和完整 CRUD 掌握在用户手中。可预测、可调试、可导出。
Letta 面向构建自主 AI 代理的工程团队——AI 在没有人在回路中的情况下运行的产品,做出决策,需要 OS 风格的记忆模型在长时间跨度内保持连贯。该框架开源,你可以阅读每一行、分叉它并自托管。
Alma 面向想要在已使用的工具中拥有带记忆 AI 的终端用户——Cursor、Claude Desktop、VSCode、Windsurf、Alma 网页应用——以及想要将完整认知层嵌入到自己产品中而无需从零编写的开发者。代价是闭源 SaaS,但带有由此带来的速度和稳定性。
| 特性 | Letta(MemGPT) | Alma |
|---|---|---|
| 目标用户 | 构建自主 AI 代理的开发者 | 终端用户 + 开发者 |
| 记忆模型 | 按位置分层:core + archival + recall(代理托管) | 按形态分类:记忆 + 情景 + 流程(用户控制) |
| 记忆策展 | 代理通过工具调用决定——可预测性因模型而异 | 用户控制:完整 CRUD、类别、重要性、评分、搜索 |
| 终端用户产品 | 无——开发者 SDK / 框架 + Letta Cloud 仪表板 | 有——带聊天、流式、工具、文件附件的完整网页应用 |
| AI 身份 | 通过系统提示 + 核心记忆的代理人格 | Soul Engine——跨 XML 部分的 13 个版本化身份区块 |
| 跨工具触及 | 你在其上构建什么就有什么——开箱不带 MCP / VSCode | MCP(Claude Desktop / Cursor / Windsurf)、VSCode、SDK、REST API |
| 创作工具 | 无 | Pro 和 Max 中的 Image / Video / Music / Code 工作室 |
| 开源 | 是(Apache 2.0) | 否(托管 SaaS) |
| 自托管 | 是 | 否 |
| 价格 | Free(自托管)· Letta Cloud(付费层) | Starter $14/mo · Pro $29/mo · Max $99/mo |
如果你愿意投入工程资源,Letta 自托管是免费的:一台服务器、一个数据库、部署、监控、更新。Letta Cloud 是托管替代方案,按使用量分付费层。Alma 的价格是固定的且对终端用户友好:Starter $14/mo(无限记忆,Haiku + Sonnet)、Pro $29/mo(增加带 1M tokens 上下文的 Opus 4.7、无限环境和创作工作室)、Max $99/mo(增加 REST API、MCP server、VSCode 扩展、SDK 和 BYOK)。每个付费套餐的年度订阅都是「付 10 个月,得 12 个月」。
构建长期运行的自主代理。团队正在构建一个在没有人为干预的情况下跨多步运行的 AI 代理——研究代理、运维代理、多步自动化。Letta 中的 OS 风格分层记忆(core / archival / recall)正是为此设计的:代理自我管理上下文中保留什么。Alma 的用户控制 3 层模型默认是对话式的;它可以通过 SDK 驱动自主循环,但策展理念相反——可预测、暴露、由用户而非代理编辑。
终端用户希望跨已使用的工具拥有记忆。Letta 面向工程团队;没有终端用户产品。Alma 就是终端用户产品。在 alma.olivares.ai 注册,在五分钟内连接 MCP server,每个支持的 AI 客户端(Claude Desktop、Cursor、Windsurf、Claude Code、VSCode)拥有相同记忆。用户从不考虑存档记忆分页或召回队列;Alma 自动处理检索。
开源、自托管要求。团队有硬性要求,所有组件运行在自己的基础设施内,带可审计源代码。Letta 是正确选择——Apache 2.0、完整源代码、想在哪里运行就在哪里。Alma 是托管 SaaS,在必须自托管时不是正确工具。
如果你正在构建自主 AI 代理——长期运行、多步、无需人为决策的代理——且 OS 风格的分层记忆抽象能清晰映射到你的问题上,选择 Letta。如果开源是不可商讨的,如果你希望自托管整个技术栈,或如果你的工程团队有带宽扩展和运营该框架,选择 Letta。Letta 的研究血统(原始 MemGPT 论文)和活跃社区在你需要将框架推向定制方向时是真正的资产。
如果你想使用带记忆的 AI,而不是为自主代理构建基础设施,选择 Alma。在 alma.olivares.ai 注册,开始聊天,记忆就能工作。如果你还在 Cursor、Claude Desktop、VSCode 或 Windsurf 中工作,安装 MCP server(免费),同一记忆将跟随你。如果你想要结构化、可预测的 AI 身份(Soul Engine),如果你需要对 AI 所知内容的完整导出和编辑控制,或如果你想要打包的创作工作室,选择 Alma。希望在自己产品中拥有完整认知层(记忆 + 情景 + 流程 + Soul + 评分的上下文组装)的开发者通过 Max 套餐获得 SDK、MCP server 和 REST API。
Letta 的分层记忆和 Alma 的 3 层记忆是一回事吗?不是。Letta 的层级描述数据相对于上下文窗口的位置(core / archival / recall)。Alma 的层级描述知识是什么类型(事实 / 事件 / 工作流)。不同的轴,不同的策展模型。
Alma 可以作为自主代理运行吗?不能在 Letta 意义上原生运行——Alma 的聊天是对话式的,由用户驱动每一轮。记忆从这些对话中累积。如果你想要完全自主的代理循环,在 Alma SDK / API 上构建它;Alma 提供认知层,你构建代理循环。
Alma 开源吗?不开源。Alma 是托管 SaaS。Letta 在 Apache 2.0 下开源,在开源是硬性要求时是正确选择。
我可以将我的 Letta 记忆迁移到 Alma 吗?目前没有一键导入。形态差异(Letta 层级与 Alma 有类型层)意味着需要结构化转换。Max 上的 REST API 让你自己写导入,如果你有 Letta 存档库并想把它带过来。
查看套餐 · 查看套餐 · 开发者文档与 SDK