Обновлено май 2026
Zep — это backend долговременной памяти для AI-агентов. Его основное отличие — временной граф знаний: по мере того как разговоры поступают, Zep автоматически извлекает сущности (люди, проекты, продукты, концепции), отслеживает их атрибуты со временем и позволяет агенту запрашивать «что мы знали о X на дату Y» или «что изменилось в X между тогда и сейчас». Графовый движок Graphiti питает это; SDK и управляемый облачный продукт оборачивают его.
Zep позиционирован для инженерных команд, строящих AI-агентов на масштабе — обычно B2B SaaS-продуктов, где AI обрабатывает сложные многоходовые взаимодействия, и команда ценит типизированное графовое рассуждение над плоским векторным извлечением. Цены в основном enterprise / custom; open-source community edition существует для self-hosting.
Alma — это полноценный продукт устойчивой памяти. Конечные пользователи регистрируются на alma.olivares.ai, общаются с Anthropic Claude (Haiku, Sonnet, Opus 4.7 с контекстом 1M tokens), и слой памяти автоматически фиксирует факты, предпочтения и решения. Soul Engine управляет идентичностью AI. Студии Image, Video, Music и Code включены в Pro и Max. Разработчики также могут использовать MCP-сервер, JavaScript SDK и REST API на тарифе Max.
Память структурирована в три уровня (memories, episodes, procedures) с пятифакторной оценкой. Платные тарифы начинаются с $14/month (Starter) с полным доступом к Soul Engine.
Временной граф знаний Zep — его самая сильная функция. Сущности — first-class citizens; Вы можете спросить «что такое проект X?», «кто работает над проектом X?», «когда изменился дедлайн?», и Zep обходит граф, чтобы ответить. Это действительно мощно, когда AI нужно рассуждать о отношениях между многими сущностями и о том, как они эволюционируют со временем — типично для customer-support AI, исследовательских агентов и B2B-автоматизации workflow.
3-уровневая модель Alma opinionated о форме: memories (факты и предпочтения), episodes (резюме разговоров) и procedures (изученные workflows). Извлечение сущностей работает эвристически на каждом создании memory (без дополнительных затрат LLM при чтении) и питает внутренний граф знаний, но пользователь-видимая модель — это три уровня, а не сам граф. Извлечение гибридное (семантическое + ключевое) с пятифакторной оценкой. Компромисс: меньше явного графового рассуждения, но гораздо более простая ментальная модель и рабочий собранный промпт менее чем за 100ms без графового языка запросов для изучения.
Zep — это инфраструктура: инженерная команда интегрирует его в свой AI-продукт. Большинство пользователей никогда не видят имя Zep; они видят Ваш продукт, который случайно их помнит. Alma — это продукт: конечные пользователи регистрируются напрямую, бренд Alma — это опыт, а разработчики — дополнительная аудитория, обслуживаемая SDK и MCP-сервером.
Если Ваша команда строит AI-агента со сложным мульти-сущностным рассуждением в основе, Zep был разработан именно для этого. Если Вы (или Ваша команда) хотите использовать AI с памятью во всех инструментах, в которых уже работаете — Cursor, Claude Desktop, VSCode — Alma покрывает это без написания интеграционного кода.
| Функция | Zep | Alma |
|---|---|---|
| Целевой пользователь | Разработчики / инженерные команды, строящие AI-агентов | Конечные пользователи + разработчики |
| Модель памяти | Временной граф знаний с извлечением сущностей (Graphiti) | 3 уровня (memories + episodes + procedures) с внутренним графом сущностей |
| Веб-приложение / чат | Нет — только API и admin dashboard | Да — полный чат со стримингом, инструментами, прикреплениями файлов |
| Идентичность AI | Не предоставляется — приносите свою | Soul Engine (13 версионируемых блоков идентичности) |
| Временная осведомлённость | First-class — отслеживает изменения сущностей во времени | Episodes + временные метки memory + угасание важности (без графового языка запросов) |
| Сборка контекста | Приносите свою — графовые запросы возвращают данные, Вы строите промпт | Встроенная — собранный системный промпт <100ms, 5-факторная оценка |
| Интеграции | SDK, REST API, адаптеры фреймворков | MCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API |
| Творческие инструменты | Нет | Студии Image / Video / Music / Code в Pro и Max |
| BYOK | N/A | Да на Max — Anthropic, Replicate, Leonardo, ElevenLabs |
| Сложность настройки | Высокая — концепции graph DB, интеграционная работа | Зарегистрируйтесь и общайтесь — никакой инфраструктуры для пользователей |
| Цены | Open-source community edition · cloud / enterprise (custom) | Starter $14/month · Pro $29/month · Max $99/month |
Open-source community edition Zep работает бесплатно, если Вы self-host'ите графовую базу данных и пишете интеграционный код. Хостинговые cloud и enterprise-тарифы котируются по запросу и нацелены на команды, отгружающие AI-агентов на масштабе. Цены Alma прямолинейны и end-user-дружелюбны: Starter $14/month (безлимитные memories, Haiku + Sonnet), Pro $29/month (добавляет Opus 4.7 с контекстом 1M tokens, безлимитные environments и творческие студии), Max $99/month (добавляет API, MCP-сервер, расширение VSCode, SDK и BYOK). Годовая оплата — «плати 10 месяцев, получи 12» на каждом платном тарифе.
End-user-память между инструментами. Пользователь хочет AI с памятью в Claude Desktop, Cursor, VSCode и в вебе. У Zep нет end-user-продукта — это инфраструктура для встраивания в чужой продукт. Alma — это сам end-user-продукт: зарегистрируйтесь, подключите MCP-сервер, и у каждого поддерживаемого клиента есть память за пять минут.
B2B customer-support-агент с временным рассуждением. Инженерная команда строит AI-агента, обрабатывающего тикеты поддержки, которому нужно рассуждать о «что мы знали об аккаунте X на дату Y» или «когда изменились условия контракта». Временной граф знаний Zep (Graphiti) разработан специально для этого — сущности — first-class citizens, атрибуты отслеживаются во времени, графовые запросы естественно отвечают на временные вопросы. Типизированная 3-уровневая модель Alma может отвечать «что мы знаем о X» через поиск, но не открывает явных временных графовых запросов — это дифференцированная сила Zep.
Соло-разработчик, желающий память в собственном AI-сайд-проекте. Разработчик строит небольшой AI-инструмент и хочет устойчивую память без поднятия графовой базы данных, запуска миграций и написания кода графовых запросов. SDK Alma на Max ($99/month) предоставляет полный когнитивный слой (память + Soul + сборка контекста) с HTTP API. Self-hosted community edition Zep также бесплатен для этого случая, но ожидает инженерных вложений до того, как отгрузится первая функция.
Выберите Zep, если Вы — инженерная команда, строящая AI-агента-продукт, где временное рассуждение о сущностях — в основе опыта — customer-support AI, отслеживающий аккаунты, исследовательский агент, следующий за гипотезами недели, enterprise-автоматизация workflow, которой нужно точно знать, когда факт изменился и почему. Графовая модель окупается, когда «покажи мне состояние сущности X на дату Y» — это реальный запрос, на который Вам нужно отвечать. Вы будете писать интеграционный код и, вероятно, обёрточный UI; это сделка.
Выберите Alma, если Вы хотите использовать память AI, а не строить инфраструктуру. Зарегистрируйтесь, начните общение, и память работает. Если Вы также работаете в Cursor / Claude Desktop / VSCode / Windsurf, установите MCP-сервер (бесплатно), и та же память следует за Вами. Выберите Alma, если Вы хотите структурированную идентичность AI (Soul Engine), встроенные творческие студии или доступную подписку для одного пользователя. Разработчики, которые хотят встроить Alma в собственные приложения, получают SDK, MCP-сервер и REST API на тарифе Max ($99/month) — полный когнитивный слой вместо просто backend памяти.
Есть ли у Alma временная осведомлённость? Да, но с другой моделью. Memories несут временные метки создания и последнего доступа; episodes — это резюме разговоров, упорядоченные по времени; угасание важности (5-факторная оценка включает недавность 10%) позволяет старым memories естественно угасать. Нет графового языка запросов для «состояние на момент T» — это дифференцированная функция Zep, а не Alma.
Есть ли у Alma граф знаний сущностей? Да, внутренне. Извлечение сущностей работает эвристически на каждом создании memory (без дополнительных затрат LLM при чтении) и питает граф, используемый во время извлечения. Сегодня он не доступен пользователю для запросов как граф; пользователь-видимая модель остаётся «memories / episodes / procedures».
Может ли Alma заменить Zep в моём AI-агент-продукте? Иногда. Если Ваш агент end-user-facing, и потребности памяти — «помнить предпочтения, решения и контекст между сессиями», SDK + REST API Alma на Max дают Вам то, что нужно, без построения обёртки. Если Вам нужны явные временные графовые запросы, Zep — правильный инструмент.
Является ли Alma open source? Нет. Alma — это хостинговый SaaS. Zep поставляет open-source community edition, который можно self-host'ить.
Zep разработан специально для инженерных команд, отгружающих AI-агентов, которым нужно явное временное графовое рассуждение. Alma — правильный инструмент, когда Вы хотите полноценный продукт памяти (чат, Soul Engine, MCP, творческие студии) без инфраструктурной работы или когда Вам нужен когнитивный слой для собственного приложения без написания типизированной модели памяти и Soul Engine самим. Тариф Starter ($14/month) показывает Вам продукт от начала до конца за пять минут.
Посмотреть тарифы · Посмотреть тарифы · Документация для разработчиков и SDK