Оновлено: травень 2026
Letta — це продакшн-еволюція MemGPT, дослідницької статті 2023 року, яка запропонувала розглядати контекстне вікно LLM як ОС-аналог RAM і використовувати «пейджинг памʼяті» для обміну менш релевантних фактів. Фреймворк постачається з відкритим кодом під Apache 2.0 і призначений для інженерних команд, що будують автономних агентів ШІ — агентів, які діють у багато кроків без людини в петлі, підтримують стан між сесіями і мають міркувати про власну памʼять.
Багаторівнева памʼять Letta має три шари: core memory (завжди в контексті, редагується самим агентом через виклики інструментів), archival memory (доступна для векторного пошуку, запитується агентом) і recall memory (повна історія розмов). Визначальна риса — це самокерування: агент вирішує, що просувається у core, що архівується, що забувається. Існує також Letta Cloud (платний розміщений тариф) і вебінтерфейс, орієнтований на розробників, для побудови і тестування агентів.
Alma — це повноцінний продукт постійної памʼяті для кінцевих користувачів і розробників. Кінцеві користувачі реєструються на alma.olivares.ai, спілкуються з Anthropic Claude (Haiku, Sonnet, Opus 4.7 з контекстом на 1M токенів), а шар памʼяті автоматично захоплює факти, вподобання і рішення. Soul Engine відповідає за ідентичність. Студії Image, Video, Music і Code входять у комплект. Розробники також можуть дістатися тієї самої памʼяті через MCP-сервер, JavaScript SDK та REST API на тарифі Max.
Памʼять структурована у трьох шарах (memories / episodes / procedures), кожен типізований, кожен отримується по-різному. Платні тарифи починаються від $14/місяць (Starter) з повним Soul Engine і необмеженою кількістю спогадів.
Обидва мають три шари, але філософія протилежна. Рівні Letta — про де живуть дані відносно контекстного вікна — core (завжди в), archival (один виклик інструмента геть), recall (вся історія). Агент переміщує дані між рівнями за допомогою вбудованих інструментів.
Шари Alma — про який це вид знання — memories (факти), episodes (події), procedures (робочі процеси). Кожен шар має власні правила пошуку і життєвого циклу. Користувач може читати, редагувати, оцінювати і видаляти будь-що в будь-якому шарі. Збирання контексту компонує їх у системний промпт перед кожним чатом — користувачу не треба думати про це, але він може перевірити все.
Найбільше значення має вісь контролю. Letta — керована агентом: сам LLM є куратором. Це потужно для автономних агентів, але важче передбачити — Ваш агент може вирішити, що Ваша перевага щодо стека неважлива, і архівувати її. Alma — під контролем користувача: важливість, впевненість, категорія і повний CRUD — у руках користувача. Передбачувано, придатно до зневадження, експортовно.
Letta — для інженерних команд, що будують автономних агентів ШІ — продукти, де ШІ працює без людини в петлі, приймає рішення і потребує ОС-стильної моделі памʼяті, щоб залишатися когерентним на довгих горизонтах. Фреймворк відкритий, тож Ви можете прочитати кожен рядок, форкнути його і розгорнути самостійно.
Alma — для кінцевих користувачів, що хочуть ШІ з памʼяттю в інструментах, з якими вони вже працюють — Cursor, Claude Desktop, VSCode, Windsurf, вебзастосунок Alma — і для розробників, що хочуть повноцінний когнітивний шар для вбудовування у власні продукти без побудови його з нуля. Компроміс — закритий код SaaS, але зі швидкістю і стабільністю, що приходять з ним.
| Функція | Letta (MemGPT) | Alma |
|---|---|---|
| Цільовий користувач | Розробники, що будують автономних агентів ШІ | Кінцеві користувачі + розробники |
| Модель памʼяті | Багаторівнева за розташуванням: core + archival + recall (керується агентом) | Типізована за формою: memories + episodes + procedures (під контролем користувача) |
| Курування памʼяті | Агент вирішує через виклики інструментів — передбачуваність залежить від моделі | Контролює користувач: повний CRUD, категорії, важливість, скоринг, пошук |
| Продукт для кінцевого користувача | Ні — SDK / фреймворк розробника + панель Letta Cloud | Так — повноцінний вебзастосунок з чатом, стрімінгом, інструментами, вкладеннями файлів |
| Ідентичність ШІ | Персона агента через системний промпт + core memory | Soul Engine — 13 версіонованих блоків ідентичності у XML-секціях |
| Охоплення між інструментами | Що б Ви не побудували поверх — без MCP / VSCode «з коробки» | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Творчі інструменти | Немає | Студії Image / Video / Music / Code на Pro і Max |
| Відкритий код | Так (Apache 2.0) | Ні (розміщений SaaS) |
| Самостійне розгортання | Так | Ні |
| Ціноутворення | Безкоштовно (самостійне розгортання) · Letta Cloud (платні тарифи) | Starter $14/місяць · Pro $29/місяць · Max $99/місяць |
Самостійно розгорнута Letta — безкоштовна, якщо Ви приносите інженерні зусилля: сервер, базу даних, розгортання, моніторинг, оновлення. Letta Cloud — це керована альтернатива з платними тарифами на основі використання. Ціноутворення Alma — фіксоване і дружнє до кінцевого користувача: Starter $14/місяць (необмежена памʼять, Haiku + Sonnet), Pro $29/місяць (додає Opus 4.7 з контекстом на 1M токенів, необмежені environments і творчі студії), Max $99/місяць (додає REST API, MCP-сервер, розширення VSCode, SDK і BYOK). Річна оплата — «платіть за 10 місяців, отримуйте 12» на кожному платному тарифі.
Побудова довгопрацюючого автономного агента. Команда будує агента ШІ, що працює у багато кроків без втручання людини — дослідницькі агенти, ops-агенти, багатокрокова автоматизація. ОС-стильна багаторівнева памʼять у Letta (core / archival / recall) розроблена саме для цього: агент сам керує тим, що залишається в контексті. 3-шарова модель Alma під контролем користувача — розмовна за замовчуванням; вона може керувати автономною петлею через SDK, але філософія курування протилежна — передбачувана, виставлена, редагована користувачем, а не агентом.
Кінцевий користувач хоче памʼяті в інструментах, які вже використовує. Letta — для інженерних команд; немає продукту для кінцевого користувача. Alma — це сам продукт для кінцевого користувача. Зареєструйтеся на alma.olivares.ai, підключіть MCP-сервер за пʼять хвилин — і кожен підтримуваний клієнт ШІ (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) має ту саму памʼять. Користувач ніколи не думає про пейджинг архівної памʼяті чи черги відкликання; Alma опрацьовує пошук автоматично.
Вимога відкритого коду, самостійного розгортання. У команди жорстка вимога, щоб усі компоненти працювали всередині їхньої власної інфраструктури з аудитованим джерелом. Letta — правильний вибір — Apache 2.0, повне джерело, запускайте, де хочете. Alma — це розміщений SaaS, і не є правильним інструментом, коли самостійне розгортання обовʼязкове.
Оберіть Letta, якщо Ви будуєте автономних агентів ШІ — довгопрацюючих, багатокрокових, таких, що приймають рішення без людини — і ОС-стильна абстракція багаторівневої памʼяті чисто проєктується на Вашу проблему. Оберіть Letta, якщо відкритий код не обговорюється, якщо Ви хочете самостійно розгорнути весь стек, або якщо Ваша інженерна команда має пропускну здатність, щоб розширювати і експлуатувати фреймворк. Дослідницький родовід Letta (оригінальна стаття MemGPT) і активна спільнота — реальні переваги, коли Вам треба штовхати фреймворк у користувацьких напрямках.
Оберіть Alma, якщо Ви хочете використовувати ШІ з памʼяттю, а не будувати інфраструктуру для автономних агентів. Зареєструйтесь на alma.olivares.ai, починайте спілкуватися — памʼять працює. Якщо Ви також працюєте в Cursor, Claude Desktop, VSCode чи Windsurf, встановіть MCP-сервер (безкоштовно) — і та сама памʼять супроводжує Вас. Оберіть Alma, якщо Ви хочете структурованої, передбачуваної ідентичності ШІ (Soul Engine), якщо Вам потрібний повний контроль над експортом і редагуванням того, що знає ШІ, або якщо Ви хочете творчих студій у комплекті. Розробники, що хочуть повноцінного когнітивного шару у власному продукті (memories + episodes + procedures + Soul + скорований контекст-ассемблер), отримують SDK, MCP-сервер і REST API на тарифі Max.
Чи багаторівнева памʼять Letta і 3-шарова памʼять Alma — це те саме? Ні. Рівні Letta описують, де живуть дані відносно контекстного вікна (core / archival / recall). Шари Alma описують, який вид знання це є (факти / події / робочі процеси). Різні осі, різні моделі курування.
Чи може Alma працювати як автономний агент? Не нативно у сенсі Letta — чат Alma розмовний, з користувачем, що керує кожним ходом. Памʼять накопичується з цих розмов. Якщо Ви хочете повністю автономну петлю агента, побудуйте її на SDK / API Alma; Alma дає Вам когнітивний шар, Ви будуєте петлю агента.
Чи є Alma відкритим кодом? Ні. Alma — це розміщений SaaS. Letta — відкритий код під Apache 2.0 і є правильним вибором, якщо відкритий код — жорстка вимога.
Чи можу я мігрувати свої спогади Letta в Alma? Не через імпорт одним кліком сьогодні. Відмінність у формі (рівні Letta проти типізованих шарів Alma) означає, що це потребуватиме структурованого перетворення. REST API на Max дозволяє Вам написати імпорт самостійно, якщо у Вас є архівне сховище Letta і Ви хочете перенести його.
Переглянути тарифи · Переглянути тарифи · Документація і SDK для розробників