Alma против Zep

Обновлено май 2026

Zep — это инфраструктурный продукт для разработчиков: временной граф знаний, который автоматически извлекает сущности из разговоров и отслеживает, как факты меняются со временем. Вы интегрируете его в собственное AI-приложение через API или SDK. Alma — это полноценный продукт: веб-приложение, чат с Claude, идентичность Soul Engine, MCP-сервер, расширение VSCode и творческие студии — готов к использованию без написания инфраструктурного кода.

Что такое Zep?

Zep — это backend долговременной памяти для AI-агентов. Его основное отличие — временной граф знаний: по мере того как разговоры поступают, Zep автоматически извлекает сущности (люди, проекты, продукты, концепции), отслеживает их атрибуты со временем и позволяет агенту запрашивать «что мы знали о X на дату Y» или «что изменилось в X между тогда и сейчас». Графовый движок Graphiti питает это; SDK и управляемый облачный продукт оборачивают его.

Zep позиционирован для инженерных команд, строящих AI-агентов на масштабе — обычно B2B SaaS-продуктов, где AI обрабатывает сложные многоходовые взаимодействия, и команда ценит типизированное графовое рассуждение над плоским векторным извлечением. Цены в основном enterprise / custom; open-source community edition существует для self-hosting.

Что такое Alma?

Alma — это полноценный продукт устойчивой памяти. Конечные пользователи регистрируются на alma.olivares.ai, общаются с Anthropic Claude (Haiku, Sonnet, Opus 4.7 с контекстом 1M tokens), и слой памяти автоматически фиксирует факты, предпочтения и решения. Soul Engine управляет идентичностью AI. Студии Image, Video, Music и Code включены в Pro и Max. Разработчики также могут использовать MCP-сервер, JavaScript SDK и REST API на тарифе Max.

Память структурирована в три уровня (memories, episodes, procedures) с пятифакторной оценкой. Платные тарифы начинаются с $14/month (Starter) с полным доступом к Soul Engine.

Как они отличаются по архитектуре памяти?

Временной граф знаний Zep — его самая сильная функция. Сущности — first-class citizens; Вы можете спросить «что такое проект X?», «кто работает над проектом X?», «когда изменился дедлайн?», и Zep обходит граф, чтобы ответить. Это действительно мощно, когда AI нужно рассуждать о отношениях между многими сущностями и о том, как они эволюционируют со временем — типично для customer-support AI, исследовательских агентов и B2B-автоматизации workflow.

3-уровневая модель Alma opinionated о форме: memories (факты и предпочтения), episodes (резюме разговоров) и procedures (изученные workflows). Извлечение сущностей работает эвристически на каждом создании memory (без дополнительных затрат LLM при чтении) и питает внутренний граф знаний, но пользователь-видимая модель — это три уровня, а не сам граф. Извлечение гибридное (семантическое + ключевое) с пятифакторной оценкой. Компромисс: меньше явного графового рассуждения, но гораздо более простая ментальная модель и рабочий собранный промпт менее чем за 100ms без графового языка запросов для изучения.

Как они отличаются по целевому пользователю?

Zep — это инфраструктура: инженерная команда интегрирует его в свой AI-продукт. Большинство пользователей никогда не видят имя Zep; они видят Ваш продукт, который случайно их помнит. Alma — это продукт: конечные пользователи регистрируются напрямую, бренд Alma — это опыт, а разработчики — дополнительная аудитория, обслуживаемая SDK и MCP-сервером.

Если Ваша команда строит AI-агента со сложным мульти-сущностным рассуждением в основе, Zep был разработан именно для этого. Если Вы (или Ваша команда) хотите использовать AI с памятью во всех инструментах, в которых уже работаете — Cursor, Claude Desktop, VSCode — Alma покрывает это без написания интеграционного кода.

Сравнение по функциям

ФункцияZepAlma
Целевой пользовательРазработчики / инженерные команды, строящие AI-агентовКонечные пользователи + разработчики
Модель памятиВременной граф знаний с извлечением сущностей (Graphiti)3 уровня (memories + episodes + procedures) с внутренним графом сущностей
Веб-приложение / чатНет — только API и admin dashboardДа — полный чат со стримингом, инструментами, прикреплениями файлов
Идентичность AIНе предоставляется — приносите своюSoul Engine (13 версионируемых блоков идентичности)
Временная осведомлённостьFirst-class — отслеживает изменения сущностей во времениEpisodes + временные метки memory + угасание важности (без графового языка запросов)
Сборка контекстаПриносите свою — графовые запросы возвращают данные, Вы строите промптВстроенная — собранный системный промпт <100ms, 5-факторная оценка
ИнтеграцииSDK, REST API, адаптеры фреймворковMCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API
Творческие инструментыНетСтудии Image / Video / Music / Code в Pro и Max
BYOKN/AДа на Max — Anthropic, Replicate, Leonardo, ElevenLabs
Сложность настройкиВысокая — концепции graph DB, интеграционная работаЗарегистрируйтесь и общайтесь — никакой инфраструктуры для пользователей
ЦеныOpen-source community edition · cloud / enterprise (custom)Starter $14/month · Pro $29/month · Max $99/month

Сравнение цен

Open-source community edition Zep работает бесплатно, если Вы self-host'ите графовую базу данных и пишете интеграционный код. Хостинговые cloud и enterprise-тарифы котируются по запросу и нацелены на команды, отгружающие AI-агентов на масштабе. Цены Alma прямолинейны и end-user-дружелюбны: Starter $14/month (безлимитные memories, Haiku + Sonnet), Pro $29/month (добавляет Opus 4.7 с контекстом 1M tokens, безлимитные environments и творческие студии), Max $99/month (добавляет API, MCP-сервер, расширение VSCode, SDK и BYOK). Годовая оплата — «плати 10 месяцев, получи 12» на каждом платном тарифе.

Распространённые workflows на практике

End-user-память между инструментами. Пользователь хочет AI с памятью в Claude Desktop, Cursor, VSCode и в вебе. У Zep нет end-user-продукта — это инфраструктура для встраивания в чужой продукт. Alma — это сам end-user-продукт: зарегистрируйтесь, подключите MCP-сервер, и у каждого поддерживаемого клиента есть память за пять минут.

B2B customer-support-агент с временным рассуждением. Инженерная команда строит AI-агента, обрабатывающего тикеты поддержки, которому нужно рассуждать о «что мы знали об аккаунте X на дату Y» или «когда изменились условия контракта». Временной граф знаний Zep (Graphiti) разработан специально для этого — сущности — first-class citizens, атрибуты отслеживаются во времени, графовые запросы естественно отвечают на временные вопросы. Типизированная 3-уровневая модель Alma может отвечать «что мы знаем о X» через поиск, но не открывает явных временных графовых запросов — это дифференцированная сила Zep.

Соло-разработчик, желающий память в собственном AI-сайд-проекте. Разработчик строит небольшой AI-инструмент и хочет устойчивую память без поднятия графовой базы данных, запуска миграций и написания кода графовых запросов. SDK Alma на Max ($99/month) предоставляет полный когнитивный слой (память + Soul + сборка контекста) с HTTP API. Self-hosted community edition Zep также бесплатен для этого случая, но ожидает инженерных вложений до того, как отгрузится первая функция.

Когда следует выбрать Zep?

Выберите Zep, если Вы — инженерная команда, строящая AI-агента-продукт, где временное рассуждение о сущностях — в основе опыта — customer-support AI, отслеживающий аккаунты, исследовательский агент, следующий за гипотезами недели, enterprise-автоматизация workflow, которой нужно точно знать, когда факт изменился и почему. Графовая модель окупается, когда «покажи мне состояние сущности X на дату Y» — это реальный запрос, на который Вам нужно отвечать. Вы будете писать интеграционный код и, вероятно, обёрточный UI; это сделка.

Когда следует выбрать Alma?

Выберите Alma, если Вы хотите использовать память AI, а не строить инфраструктуру. Зарегистрируйтесь, начните общение, и память работает. Если Вы также работаете в Cursor / Claude Desktop / VSCode / Windsurf, установите MCP-сервер (бесплатно), и та же память следует за Вами. Выберите Alma, если Вы хотите структурированную идентичность AI (Soul Engine), встроенные творческие студии или доступную подписку для одного пользователя. Разработчики, которые хотят встроить Alma в собственные приложения, получают SDK, MCP-сервер и REST API на тарифе Max ($99/month) — полный когнитивный слой вместо просто backend памяти.

Часто задаваемые вопросы

Есть ли у Alma временная осведомлённость? Да, но с другой моделью. Memories несут временные метки создания и последнего доступа; episodes — это резюме разговоров, упорядоченные по времени; угасание важности (5-факторная оценка включает недавность 10%) позволяет старым memories естественно угасать. Нет графового языка запросов для «состояние на момент T» — это дифференцированная функция Zep, а не Alma.

Есть ли у Alma граф знаний сущностей? Да, внутренне. Извлечение сущностей работает эвристически на каждом создании memory (без дополнительных затрат LLM при чтении) и питает граф, используемый во время извлечения. Сегодня он не доступен пользователю для запросов как граф; пользователь-видимая модель остаётся «memories / episodes / procedures».

Может ли Alma заменить Zep в моём AI-агент-продукте? Иногда. Если Ваш агент end-user-facing, и потребности памяти — «помнить предпочтения, решения и контекст между сессиями», SDK + REST API Alma на Max дают Вам то, что нужно, без построения обёртки. Если Вам нужны явные временные графовые запросы, Zep — правильный инструмент.

Является ли Alma open source? Нет. Alma — это хостинговый SaaS. Zep поставляет open-source community edition, который можно self-host'ить.

Итог

Zep разработан специально для инженерных команд, отгружающих AI-агентов, которым нужно явное временное графовое рассуждение. Alma — правильный инструмент, когда Вы хотите полноценный продукт памяти (чат, Soul Engine, MCP, творческие студии) без инфраструктурной работы или когда Вам нужен когнитивный слой для собственного приложения без написания типизированной модели памяти и Soul Engine самим. Тариф Starter ($14/month) показывает Вам продукт от начала до конца за пять минут.

Посмотреть тарифы · Посмотреть тарифы · Документация для разработчиков и SDK

See plans