Апрель 2026 · чтение 10 мин · Fran Olivares, основатель OlivaresAI
@olivaresai/alma-mcp, в конфигурацию Вашего клиента за пять минут — без кода; используйте JavaScript SDK для получения контекста перед вызовами LLM и извлечения memories после; или вызывайте REST API напрямую из любого языка. Все три подключаются к одному и тому же слою памяти Alma.Каждый AI-разговор начинается с нуля. Ваш ассистент забывает Ваше имя, проект, предпочтения — каждый раз. Это фундаментальное ограничение AI без состояния, и это главная причина, почему AI ощущается как инструмент, а не как соавтор. Это руководство проводит Вас через три конкретных подхода к решению, от настройки без кода до полной интеграции через API.
Когда Вы используете ChatGPT, Claude или любой AI-чат, контекст исчезает, когда разговор заканчивается. Вы объясняете одно и то же снова и снова: свой технический стек, стиль кода, архитектуру проекта, предпочтения. Это тратит время и даёт худшие результаты, потому что AI никогда не строит глубокого понимания того, кто Вы и над чем работаете.
Нативные функции памяти платформ (ChatGPT Memory, Claude Projects) помогают, но они ограничены по ёмкости, замкнуты на одну платформу и не предлагают API для разработчиков. Если Вы создаёте AI-продукт, Вам нужен независимый слой памяти.
Model Context Protocol (MCP) — самый быстрый путь. Если Ваш AI работает в Claude Desktop, Cursor, Windsurf, Claude Code или любом MCP-совместимом клиенте, Вы можете добавить устойчивую память менее чем за 5 минут.
Шаг 1: Зарегистрируйтесь на alma.olivares.ai и сгенерируйте API-ключ в «Настройках».
Шаг 2: Добавьте @olivaresai/alma-mcp в конфигурацию Вашего MCP-клиента с Вашим API-ключом. Для Claude Desktop отредактируйте claude_desktop_config.json. Для Cursor используйте панель настроек MCP.
Шаг 3: Перезапустите клиент. Сервер открывает 35 инструментов: alma_remember (сохранить memory), alma_recall (поиск по memories), alma_assemble (построить контекст из всех уровней памяти), alma_extract (извлечь факты из текста) и другие. Ваш AI теперь может читать из хранилища устойчивой памяти и писать в него, и это сохраняется между всеми разговорами.
MCP идеален для личных рабочих процессов — Claude Desktop для общей AI-работы, Cursor для разработки, Claude Code для терминальной разработки. Одна память, везде.
JavaScript SDK (@olivaresai/alma-sdk) даёт полный программный контроль для собственных приложений. Основной шаблон интеграции состоит из трёх шагов:
client.context.assemble({ query }), чтобы получить системный промпт, обогащённый релевантными memories, episodes, procedures и soul-блоками.client.memories.extract({ text }), чтобы сохранить новые факты из разговора. Или создайте memories напрямую через client.memories.create().SDK оборачивает все 140+ эндпоинтов API с полными типами TypeScript. Установка через npm install @olivaresai/alma-sdk. Только ESM, требует Node.js 18+.
REST API предоставляет прямой HTTP-доступ из любого языка или платформы. Ключевые эндпоинты:
POST /api/v1/context/assemble — Построить промпт контекста из memories, episodes, procedures и soul-блоковPOST /api/v1/memories — Создать memory с содержимым, категорией, важностью и уверенностьюGET /api/v1/memories/search?q=query&mode=hybrid — Гибридный семантический + ключевой поискPOST /api/v1/memories/extract — Извлечение фактов из текста через LLMPOST /api/v1/blocks — Настройка soul-блоков Soul Engine для идентичности AIАутентификация через API-ключ (заголовок X-API-Key). Базовый URL: https://alma.olivares.ai/api/v1.
Трёхуровневая архитектура Alma разделяет знание на три типа:
Когда Вы начинаете разговор, сборка контекста ищет во всех трёх уровнях через гибридный поиск, оценивает результаты по релевантности (50%), важности (15%), уверенности (15%), недавности (10%) и частоте (10%), затем вставляет наилучший контекст в системный промпт — всё менее чем за 100ms.
Memories автоматически извлекаются из разговоров каждые 4 сообщения. Экстрактор идентифицирует 0-30 фактов на разговор через Claude Haiku. Дубликаты обнаруживаются через сходство Jaccard (порог 60%) и объединяются. Устаревшие memories с низкой важностью истекают после 120 дней неактивности.
Память одна даёт Вашему AI факты. Soul Engine даёт ему идентичность. Настройте структурированные блоки — характер, экспертизу, стиль общения, правила и контекст — которые сохраняются во всех разговорах. В отличие от одиночного системного промпта, который теряется в длинных разговорах, блоки Soul Engine версионируемы, организованы и всегда вставляются с приоритетом.
Environments позволяют изолировать контексты памяти. Держите рабочие, личные и клиентские memories полностью отдельно. У каждого environment свои memories, episodes, procedures и soul-блоки. AI переключает характер и знания, когда Вы переключаете environments.
Начните на alma.olivares.ai. Тариф Starter ($14/month) включает безлимитные memories на недельный AI-бюджет $2, 1 environment и полный доступ к чату. Все методы интеграции — MCP, SDK, API — работают на каждом тарифе.
Для большей глубины: Управление памятью AI: полное руководство 2026 · Создание AI-ассистентов, которые помнят всё · Устойчивая память против RAG