2026 年 4 月 · 10 分钟阅读 · Fran Olivares,OlivaresAI 创始人
@olivaresai/alma-mcp 等 MCP server 安装到你的客户端配置中——无需代码;使用 JavaScript SDK 在 LLM 调用前获取上下文,并在调用后提取记忆;或从任何语言直接调用 REST API。三者都连接到同一个 Alma 记忆层。每次 AI 对话都从零开始。你的助手会忘记你的名字、你的项目、你的偏好——每一次都是如此。这是无状态 AI 的根本限制,也是 AI 感觉像工具而非协作者的最大单一原因。本指南将带你了解三种具体的解决方法,从零代码设置到完整的 API 集成。
当你使用 ChatGPT、Claude 或任何 AI 聊天时,上下文在对话结束时消失。你一遍又一遍解释相同的事情:你的技术栈、你的编码风格、你的项目架构、你的偏好。这浪费时间并产生更差的结果,因为 AI 永远无法对你是谁或你在做什么建立深入理解。
平台原生记忆功能(ChatGPT Memory、Claude Projects)有所帮助,但容量有限,锁定在单一平台,且没有开发者 API。如果你正在构建一个由 AI 驱动的产品,你需要一个独立的记忆层。
Model Context Protocol(MCP)是最快的路径。如果你的 AI 运行在 Claude Desktop、Cursor、Windsurf、Claude Code 或任何兼容 MCP 的客户端中,你可以在 5 分钟内添加持久记忆。
第 1 步:在 alma.olivares.ai 注册并在设置中生成一个 API 密钥。
第 2 步:将 @olivaresai/alma-mcp 添加到你的 MCP 客户端配置,并填入你的 API 密钥。对于 Claude Desktop,编辑 claude_desktop_config.json。对于 Cursor,使用 MCP 设置面板。
第 3 步:重启你的客户端。该 server 暴露 35 个工具:alma_remember(保存记忆)、alma_recall(搜索记忆)、alma_assemble(从所有记忆层构建上下文)、alma_extract(从文本中提取事实)等等。你的 AI 现在可以读写一个在每次对话间存续的持久记忆存储。
MCP 是个人工作流的理想选择——Claude Desktop 用于通用 AI 工作,Cursor 用于编码,Claude Code 用于基于终端的开发。一份记忆,处处可用。
JavaScript SDK(@olivaresai/alma-sdk)为自定义应用提供完全的编程控制。核心集成模式有三步:
client.context.assemble({ query }) 以获取一个由相关记忆、情景、流程和灵魂区块所丰富的系统提示。client.memories.extract({ text }) 以保存对话中的新事实。或者使用 client.memories.create() 直接创建记忆。SDK 用完整的 TypeScript 类型包装了所有 140+ API 端点。使用 npm install @olivaresai/alma-sdk 安装。它仅支持 ESM,需要 Node.js 18+。
REST API 提供来自任何语言或平台的直接 HTTP 访问。关键端点:
POST /api/v1/context/assemble——从记忆、情景、流程和灵魂区块构建上下文提示POST /api/v1/memories——使用内容、类别、重要性和置信度创建记忆GET /api/v1/memories/search?q=query&mode=hybrid——混合语义 + 关键词搜索POST /api/v1/memories/extract——由 LLM 驱动的文本事实提取POST /api/v1/blocks——配置用于 AI 身份的 Soul Engine 区块通过 API 密钥(X-API-Key 头)进行认证。基础 URL:https://alma.olivares.ai/api/v1。
Alma 的三层架构将知识分为三种类型:
当你开始对话时,上下文组装使用混合搜索在三层中搜索,按相关性(50%)、重要性(15%)、置信度(15%)、新近度(10%)和频次(10%)对结果评分,然后将排名最高的上下文注入系统提示——全部在 100ms 内完成。
记忆每 4 条消息自动从对话中提取。提取器使用 Claude Haiku 每次对话识别 0-30 条事实。通过 Jaccard 相似度(60% 阈值)检测重复并合并。重要性较低的过时记忆在 120 天无活动后过期。
仅靠记忆给你的 AI 提供事实。Soul Engine 给它身份。配置结构化区块——人格、专长、沟通风格、规则和上下文——它们在每次对话中持续存在。与在长对话中会被稀释的单一系统提示不同,Soul Engine 区块经过版本化、组织化,并始终以高优先级注入。
环境让你隔离记忆上下文。让工作、个人和按客户分类的记忆完全分离。每个环境拥有自己的记忆、情景、流程和灵魂区块。切换环境时,AI 也会切换人格和知识。
在 alma.olivares.ai 开始。Starter 套餐($14/mo)包含无限记忆、每周 $2 的 AI 预算、1 个环境以及完整的聊天访问。所有集成方法——MCP、SDK、API——在每个套餐中都可用。
深入了解:AI 记忆管理:2026 完整指南 · 构建能记住一切的 AI 助手 · 持久记忆与 RAG