Alma против Letta (MemGPT)

Обновлено май 2026

Letta (бывший MemGPT) — это open-source-фреймворк для построения stateful AI-агентов. Его многоуровневая память (core / archival / recall) вдохновлена виртуальной памятью операционных систем: сам агент решает, что помнить и забывать. Alma — это production SaaS, где пользователь контролирует память: 3-уровневая типизированная архитектура (memories / episodes / procedures), идентичность Soul Engine, полный UI, MCP-сервер, творческие студии.

Что такое Letta (MemGPT)?

Letta — это эволюция production-уровня MemGPT, исследовательской работы 2023 года, которая предложила рассматривать окно контекста LLM как аналог RAM операционной системы и использовать «memory paging» для замены менее релевантных фактов. Фреймворк поставляется open-source под Apache 2.0 и разработан для инженерных команд, строящих автономных AI-агентов — агентов, которые действуют в несколько шагов без человека в цикле, поддерживают состояние между сессиями и нуждаются в рассуждении о собственной памяти.

Многоуровневая память Letta имеет три уровня: core memory (всегда в контексте, редактируется самим агентом через tool-вызовы), archival memory (доступна для векторного поиска, агентно-запрашиваемая) и recall memory (полная история разговоров). Определяющая черта — самоуправление: агент решает, что продвигается в core, что архивируется, что забывается. Также есть Letta Cloud (платный хостинговый уровень) и web UI, ориентированный на разработчиков, для построения и тестирования агентов.

Что такое Alma?

Alma — это полноценный продукт устойчивой памяти для конечных пользователей и разработчиков. Конечные пользователи регистрируются на alma.olivares.ai, общаются с Anthropic Claude (Haiku, Sonnet, Opus 4.7 с контекстом 1M tokens), и слой памяти автоматически фиксирует факты, предпочтения и решения. Soul Engine управляет идентичностью. Студии Image, Video, Music и Code включены в комплект. Разработчики также могут дотянуться до той же памяти через MCP-сервер, JavaScript SDK и REST API на тарифе Max.

Память структурирована в три уровня (memories / episodes / procedures), каждый типизирован, каждый извлекается по-разному. Платные тарифы начинаются с $14/month (Starter) с полным Soul Engine с безлимитными memories.

Как они отличаются по архитектуре памяти?

У обоих три уровня, но философия противоположна. Уровни Letta — о том, где данные живут относительно окна контекста — core (всегда внутри), archival (один tool-вызов в стороне), recall (вся история). Агент перемещает данные между уровнями, используя встроенные инструменты.

Уровни Alma — о том, какой это вид знания — memories (факты), episodes (события), procedures (workflows). У каждого уровня свои правила извлечения и жизненного цикла. Пользователь может прочитать, отредактировать, оценить и удалить что угодно на любом уровне. Сборка контекста составляет их в системный промпт перед каждым чатом — пользователь не должен думать об этом, но может проверить всё.

Ось контроля имеет наибольшее значение. Letta управляется агентом: сам LLM — куратор. Это мощно для автономных агентов, но сложнее предсказать — Ваш агент может решить, что Ваше предпочтение по стеку неважно, и заархивировать его. Alma контролируется пользователем: важность, уверенность, категория и полный CRUD живут в руках пользователя. Предсказуемо, дебагибельно, экспортируемо.

Как они отличаются по целевому пользователю?

Letta — для инженерных команд, строящих автономных AI-агентов — продуктов, где AI работает без человека в цикле, принимает решения и нуждается в OS-style модели памяти, чтобы оставаться когерентным на длинных горизонтах. Фреймворк open source, так что Вы можете прочитать каждую строку, форкнуть его и self-host'ить.

Alma — для конечных пользователей, которые хотят AI с памятью во всех инструментах, в которых уже работают — Cursor, Claude Desktop, VSCode, Windsurf, веб-приложение Alma — и для разработчиков, которые хотят полный когнитивный слой для встраивания в собственные продукты без написания одного с нуля. Компромисс — closed-source SaaS, но со скоростью и стабильностью, которые с ним приходят.

Сравнение по функциям

ФункцияLetta (MemGPT)Alma
Целевой пользовательРазработчики, строящие автономных AI-агентовКонечные пользователи + разработчики
Модель памятиМногоуровневая по расположению: core + archival + recall (управляется агентом)Типизированная по форме: memories + episodes + procedures (контролируется пользователем)
Курация памятиАгент решает через tool-вызовы — предсказуемость зависит от моделиПользователь контролирует: полный CRUD, категории, важность, оценка, поиск
End-user-продуктНет — developer SDK / фреймворк + dashboard Letta CloudДа — полное веб-приложение с чатом, стримингом, инструментами, прикреплениями файлов
Идентичность AIПерсона агента через системный промпт + core memorySoul Engine — 13 версионируемых блоков идентичности в XML-секциях
Кросс-инструментальный охватЧто бы Вы ни построили сверху — нет MCP / VSCode из коробкиMCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Творческие инструментыНетСтудии Image / Video / Music / Code в Pro и Max
Open sourceДа (Apache 2.0)Нет (хостинговый SaaS)
Self-hostДаНет
ЦеныБесплатно (self-hosted) · Letta Cloud (платные тарифы)Starter $14/month · Pro $29/month · Max $99/month

Сравнение цен

Letta self-hosted бесплатна, если Вы приносите инженерные усилия: сервер, база данных, развёртывание, мониторинг, обновления. Letta Cloud — управляемая альтернатива с платными тарифами на основе использования. Цены Alma фиксированы и end-user-дружелюбны: Starter $14/month (безлимитные memories, Haiku + Sonnet), Pro $29/month (добавляет Opus 4.7 с контекстом 1M tokens, безлимитные environments и творческие студии), Max $99/month (добавляет REST API, MCP-сервер, расширение VSCode, SDK и BYOK). Годовая оплата — «плати 10 месяцев, получи 12» на каждом платном тарифе.

Распространённые workflows на практике

Построение долгоработающего автономного агента. Команда строит AI-агента, который работает в несколько шагов без вмешательства человека — исследовательские агенты, ops-агенты, многошаговая автоматизация. OS-style многоуровневая память в Letta (core / archival / recall) разработана именно для этого: агент самоуправляет тем, что остаётся в контексте. Пользовательско-контролируемая 3-уровневая модель Alma по умолчанию разговорная; она может управлять автономным циклом через SDK, но философия курации противоположна — предсказуемая, открытая, редактируемая пользователем, а не агентом.

Конечный пользователь хочет память во всех инструментах, которые он уже использует. Letta — для инженерных команд; нет end-user-продукта. Alma — это и есть end-user-продукт. Зарегистрируйтесь на alma.olivares.ai, подключите MCP-сервер за пять минут, и у каждого поддерживаемого AI-клиента (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) та же память. Пользователь никогда не думает о пейджинге archival memory или recall-очередях; Alma обрабатывает извлечение автоматически.

Требование open-source, self-host. У команды жёсткое требование, что все компоненты работают внутри собственной инфраструктуры с аудируемым исходным кодом. Letta — правильный выбор — Apache 2.0, полный исходный код, запускайте, где хотите. Alma — это хостинговый SaaS и не правильный инструмент, когда self-hosting обязателен.

Когда следует выбрать Letta?

Выберите Letta, если Вы строите автономных AI-агентов — долгоработающих, многошаговых, принимающих-решения-без-человека агентов — и OS-style абстракция многоуровневой памяти чисто отображается на Вашу задачу. Выберите Letta, если open source не подлежит обсуждению, если Вы хотите self-host'ить весь стек, или если у Вашей инженерной команды есть пропускная способность для расширения и эксплуатации фреймворка. Исследовательская линия Letta (оригинальная работа MemGPT) и активное community — реальные активы, когда Вам нужно толкать фреймворк в custom-направлениях.

Когда следует выбрать Alma?

Выберите Alma, если Вы хотите использовать AI с памятью, а не строить инфраструктуру для автономных агентов. Зарегистрируйтесь на alma.olivares.ai, начните общение, и память работает. Если Вы также работаете в Cursor, Claude Desktop, VSCode или Windsurf, установите MCP-сервер (бесплатно), и та же память следует за Вами. Выберите Alma, если Вы хотите структурированную, предсказуемую идентичность AI (Soul Engine), если Вам нужен полный экспорт и контроль редактирования того, что знает AI, или если Вам нужны встроенные творческие студии. Разработчики, которые хотят полный когнитивный слой в собственном продукте (memories + episodes + procedures + Soul + оценённая сборка контекста), получают SDK, MCP-сервер и REST API на тарифе Max.

Часто задаваемые вопросы

Являются ли многоуровневая память Letta и 3-уровневая память Alma одним и тем же? Нет. Уровни Letta описывают, где данные живут относительно окна контекста (core / archival / recall). Уровни Alma описывают, какой вид знания это (факты / события / workflows). Разные оси, разные модели курации.

Может ли Alma работать как автономный агент? Не нативно в смысле Letta — чат Alma разговорный, с пользователем, ведущим каждый ход. Память накапливается из этих разговоров. Если Вы хотите полностью автономный agent loop, постройте его на SDK / API Alma; Alma даёт Вам когнитивный слой, Вы строите agent loop.

Является ли Alma open source? Нет. Alma — это хостинговый SaaS. Letta — open source под Apache 2.0 и является правильным выбором, если open source — жёсткое требование.

Могу ли я мигрировать мои memories Letta в Alma? Не через one-click импорт сегодня. Разница форм (уровни Letta против типизированных уровней Alma) означает, что это потребует структурированной конверсии. REST API на Max позволяет Вам написать импорт самостоятельно, если у Вас есть archival store Letta, и Вы хотите перенести его.

Посмотреть тарифы · Посмотреть тарифы · Документация для разработчиков и SDK

See plans