Обновлено май 2026
Letta — это эволюция production-уровня MemGPT, исследовательской работы 2023 года, которая предложила рассматривать окно контекста LLM как аналог RAM операционной системы и использовать «memory paging» для замены менее релевантных фактов. Фреймворк поставляется open-source под Apache 2.0 и разработан для инженерных команд, строящих автономных AI-агентов — агентов, которые действуют в несколько шагов без человека в цикле, поддерживают состояние между сессиями и нуждаются в рассуждении о собственной памяти.
Многоуровневая память Letta имеет три уровня: core memory (всегда в контексте, редактируется самим агентом через tool-вызовы), archival memory (доступна для векторного поиска, агентно-запрашиваемая) и recall memory (полная история разговоров). Определяющая черта — самоуправление: агент решает, что продвигается в core, что архивируется, что забывается. Также есть Letta Cloud (платный хостинговый уровень) и web UI, ориентированный на разработчиков, для построения и тестирования агентов.
Alma — это полноценный продукт устойчивой памяти для конечных пользователей и разработчиков. Конечные пользователи регистрируются на alma.olivares.ai, общаются с Anthropic Claude (Haiku, Sonnet, Opus 4.7 с контекстом 1M tokens), и слой памяти автоматически фиксирует факты, предпочтения и решения. Soul Engine управляет идентичностью. Студии Image, Video, Music и Code включены в комплект. Разработчики также могут дотянуться до той же памяти через MCP-сервер, JavaScript SDK и REST API на тарифе Max.
Память структурирована в три уровня (memories / episodes / procedures), каждый типизирован, каждый извлекается по-разному. Платные тарифы начинаются с $14/month (Starter) с полным Soul Engine с безлимитными memories.
У обоих три уровня, но философия противоположна. Уровни Letta — о том, где данные живут относительно окна контекста — core (всегда внутри), archival (один tool-вызов в стороне), recall (вся история). Агент перемещает данные между уровнями, используя встроенные инструменты.
Уровни Alma — о том, какой это вид знания — memories (факты), episodes (события), procedures (workflows). У каждого уровня свои правила извлечения и жизненного цикла. Пользователь может прочитать, отредактировать, оценить и удалить что угодно на любом уровне. Сборка контекста составляет их в системный промпт перед каждым чатом — пользователь не должен думать об этом, но может проверить всё.
Ось контроля имеет наибольшее значение. Letta управляется агентом: сам LLM — куратор. Это мощно для автономных агентов, но сложнее предсказать — Ваш агент может решить, что Ваше предпочтение по стеку неважно, и заархивировать его. Alma контролируется пользователем: важность, уверенность, категория и полный CRUD живут в руках пользователя. Предсказуемо, дебагибельно, экспортируемо.
Letta — для инженерных команд, строящих автономных AI-агентов — продуктов, где AI работает без человека в цикле, принимает решения и нуждается в OS-style модели памяти, чтобы оставаться когерентным на длинных горизонтах. Фреймворк open source, так что Вы можете прочитать каждую строку, форкнуть его и self-host'ить.
Alma — для конечных пользователей, которые хотят AI с памятью во всех инструментах, в которых уже работают — Cursor, Claude Desktop, VSCode, Windsurf, веб-приложение Alma — и для разработчиков, которые хотят полный когнитивный слой для встраивания в собственные продукты без написания одного с нуля. Компромисс — closed-source SaaS, но со скоростью и стабильностью, которые с ним приходят.
| Функция | Letta (MemGPT) | Alma |
|---|---|---|
| Целевой пользователь | Разработчики, строящие автономных AI-агентов | Конечные пользователи + разработчики |
| Модель памяти | Многоуровневая по расположению: core + archival + recall (управляется агентом) | Типизированная по форме: memories + episodes + procedures (контролируется пользователем) |
| Курация памяти | Агент решает через tool-вызовы — предсказуемость зависит от модели | Пользователь контролирует: полный CRUD, категории, важность, оценка, поиск |
| End-user-продукт | Нет — developer SDK / фреймворк + dashboard Letta Cloud | Да — полное веб-приложение с чатом, стримингом, инструментами, прикреплениями файлов |
| Идентичность AI | Персона агента через системный промпт + core memory | Soul Engine — 13 версионируемых блоков идентичности в XML-секциях |
| Кросс-инструментальный охват | Что бы Вы ни построили сверху — нет MCP / VSCode из коробки | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Творческие инструменты | Нет | Студии Image / Video / Music / Code в Pro и Max |
| Open source | Да (Apache 2.0) | Нет (хостинговый SaaS) |
| Self-host | Да | Нет |
| Цены | Бесплатно (self-hosted) · Letta Cloud (платные тарифы) | Starter $14/month · Pro $29/month · Max $99/month |
Letta self-hosted бесплатна, если Вы приносите инженерные усилия: сервер, база данных, развёртывание, мониторинг, обновления. Letta Cloud — управляемая альтернатива с платными тарифами на основе использования. Цены Alma фиксированы и end-user-дружелюбны: Starter $14/month (безлимитные memories, Haiku + Sonnet), Pro $29/month (добавляет Opus 4.7 с контекстом 1M tokens, безлимитные environments и творческие студии), Max $99/month (добавляет REST API, MCP-сервер, расширение VSCode, SDK и BYOK). Годовая оплата — «плати 10 месяцев, получи 12» на каждом платном тарифе.
Построение долгоработающего автономного агента. Команда строит AI-агента, который работает в несколько шагов без вмешательства человека — исследовательские агенты, ops-агенты, многошаговая автоматизация. OS-style многоуровневая память в Letta (core / archival / recall) разработана именно для этого: агент самоуправляет тем, что остаётся в контексте. Пользовательско-контролируемая 3-уровневая модель Alma по умолчанию разговорная; она может управлять автономным циклом через SDK, но философия курации противоположна — предсказуемая, открытая, редактируемая пользователем, а не агентом.
Конечный пользователь хочет память во всех инструментах, которые он уже использует. Letta — для инженерных команд; нет end-user-продукта. Alma — это и есть end-user-продукт. Зарегистрируйтесь на alma.olivares.ai, подключите MCP-сервер за пять минут, и у каждого поддерживаемого AI-клиента (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) та же память. Пользователь никогда не думает о пейджинге archival memory или recall-очередях; Alma обрабатывает извлечение автоматически.
Требование open-source, self-host. У команды жёсткое требование, что все компоненты работают внутри собственной инфраструктуры с аудируемым исходным кодом. Letta — правильный выбор — Apache 2.0, полный исходный код, запускайте, где хотите. Alma — это хостинговый SaaS и не правильный инструмент, когда self-hosting обязателен.
Выберите Letta, если Вы строите автономных AI-агентов — долгоработающих, многошаговых, принимающих-решения-без-человека агентов — и OS-style абстракция многоуровневой памяти чисто отображается на Вашу задачу. Выберите Letta, если open source не подлежит обсуждению, если Вы хотите self-host'ить весь стек, или если у Вашей инженерной команды есть пропускная способность для расширения и эксплуатации фреймворка. Исследовательская линия Letta (оригинальная работа MemGPT) и активное community — реальные активы, когда Вам нужно толкать фреймворк в custom-направлениях.
Выберите Alma, если Вы хотите использовать AI с памятью, а не строить инфраструктуру для автономных агентов. Зарегистрируйтесь на alma.olivares.ai, начните общение, и память работает. Если Вы также работаете в Cursor, Claude Desktop, VSCode или Windsurf, установите MCP-сервер (бесплатно), и та же память следует за Вами. Выберите Alma, если Вы хотите структурированную, предсказуемую идентичность AI (Soul Engine), если Вам нужен полный экспорт и контроль редактирования того, что знает AI, или если Вам нужны встроенные творческие студии. Разработчики, которые хотят полный когнитивный слой в собственном продукте (memories + episodes + procedures + Soul + оценённая сборка контекста), получают SDK, MCP-сервер и REST API на тарифе Max.
Являются ли многоуровневая память Letta и 3-уровневая память Alma одним и тем же? Нет. Уровни Letta описывают, где данные живут относительно окна контекста (core / archival / recall). Уровни Alma описывают, какой вид знания это (факты / события / workflows). Разные оси, разные модели курации.
Может ли Alma работать как автономный агент? Не нативно в смысле Letta — чат Alma разговорный, с пользователем, ведущим каждый ход. Память накапливается из этих разговоров. Если Вы хотите полностью автономный agent loop, постройте его на SDK / API Alma; Alma даёт Вам когнитивный слой, Вы строите agent loop.
Является ли Alma open source? Нет. Alma — это хостинговый SaaS. Letta — open source под Apache 2.0 и является правильным выбором, если open source — жёсткое требование.
Могу ли я мигрировать мои memories Letta в Alma? Не через one-click импорт сегодня. Разница форм (уровни Letta против типизированных уровней Alma) означает, что это потребует структурированной конверсии. REST API на Max позволяет Вам написать импорт самостоятельно, если у Вас есть archival store Letta, и Вы хотите перенести его.
Посмотреть тарифы · Посмотреть тарифы · Документация для разработчиков и SDK