2026년 5월 업데이트
Letta는 LLM의 컨텍스트 창을 RAM의 OS 유사물로 취급하고 "메모리 페이징"을 사용하여 덜 관련된 사실을 들어오고 나가게 한다고 제안한 2023년 연구 논문인 MemGPT의 프로덕션 등급 진화입니다. 프레임워크는 Apache 2.0 하에 오픈 소스로 제공되며 자율 AI 에이전트를 구축하는 엔지니어링 팀을 위해 설계되었습니다 — 사람이 루프에 없이 여러 단계에 걸쳐 행동하고, 세션 전반에 상태를 유지하며, 자신의 메모리에 대해 추론해야 하는 에이전트.
Letta의 계층 메모리에는 세 가지 레이어가 있습니다: 코어 메모리(항상 컨텍스트에, 도구 호출을 통해 에이전트 자체가 편집), 아카이브 메모리(벡터 검색 가능, 에이전트 쿼리), 회상 메모리(전체 대화 기록). 정의 특성은 자체 관리입니다: 에이전트가 무엇이 코어로 승격되고, 무엇이 아카이브되고, 무엇이 잊혀지는지 결정합니다. Letta Cloud(유료 호스팅 티어)와 에이전트 구축 및 테스트를 위한 개발자 중심 웹 UI도 있습니다.
Alma는 최종 사용자와 개발자를 위한 완전한 영속 메모리 제품입니다. 최종 사용자는 alma.olivares.ai에서 가입하고 Anthropic Claude(Haiku, Sonnet, 1M 토큰 컨텍스트의 Opus 4.7)와 채팅하며 메모리 레이어는 사실, 선호도, 결정을 자동으로 캡처합니다. Soul Engine은 정체성을 처리합니다. Image, Video, Music, Code 스튜디오가 번들로 제공됩니다. 개발자도 Max 플랜에서 MCP 서버, JavaScript SDK, REST API를 통해 동일한 메모리에 도달할 수 있습니다.
메모리는 세 가지 레이어(memories / episodes / procedures)로 구조화되며, 각각 타입이 지정되고, 각각 다르게 검색됩니다. 유료 플랜은 무제한 메모리와 함께 전체 Soul Engine이 있는 $14/월(Starter)부터 시작합니다.
둘 다 세 가지 레이어를 가지지만 철학은 반대입니다. Letta의 티어는 데이터가 컨텍스트 창에 상대적으로 어디에 있는지에 관한 것입니다 — 코어(항상 안에), 아카이브(도구 호출 하나 떨어진), 회상(모든 기록). 에이전트는 내장 도구를 사용하여 티어 간 데이터를 이동합니다.
Alma의 레이어는 그것이 어떤 종류의 지식인지에 관한 것입니다 — memories(사실), episodes(이벤트), procedures(워크플로). 각 레이어는 자체 검색 및 라이프사이클 규칙을 가집니다. 사용자는 모든 레이어의 모든 것을 읽고, 편집하고, 스코어링하고, 삭제할 수 있습니다. 컨텍스트 조립은 각 채팅 전에 시스템 프롬프트로 구성합니다 — 사용자는 그것에 대해 생각할 필요가 없지만, 모든 것을 검사할 수 있습니다.
제어 축이 가장 중요합니다. Letta는 에이전트 관리입니다: LLM 자체가 큐레이터입니다. 자율 에이전트에 강력하지만 예측하기 어렵습니다 — 에이전트가 스택 선호도가 중요하지 않다고 결정하고 아카이브할 수 있습니다. Alma는 사용자 제어입니다: 중요도, 신뢰도, 카테고리, 완전한 CRUD가 사용자의 손에 있습니다. 예측 가능하고, 디버그 가능하며, 내보내기 가능합니다.
Letta는 자율 AI 에이전트를 구축하는 엔지니어링 팀을 위한 것입니다 — AI가 사람이 루프에 없이 실행되고, 결정을 내리며, 긴 지평선에 걸쳐 일관되게 유지하기 위해 OS 스타일 메모리 모델이 필요한 제품. 프레임워크는 오픈 소스이므로 모든 줄을 읽고, 포크하고, 셀프 호스팅할 수 있습니다.
Alma는 이미 작업하는 도구 — Cursor, Claude Desktop, VSCode, Windsurf, Alma 웹 앱 — 에서 메모리가 있는 AI를 원하는 최종 사용자를 위한 것이며, 처음부터 작성하지 않고 자신의 제품에 임베딩할 완전한 인지 레이어를 원하는 개발자를 위한 것입니다. 트레이드오프는 폐쇄 소스 SaaS이지만, 그와 함께 오는 속도와 안정성이 있습니다.
| 기능 | Letta (MemGPT) | Alma |
|---|---|---|
| 대상 사용자 | 자율 AI 에이전트를 구축하는 개발자 | 최종 사용자 + 개발자 |
| 메모리 모델 | 위치별 계층: 코어 + 아카이브 + 회상(에이전트 관리) | 모양별 타입: memories + episodes + procedures(사용자 제어) |
| 메모리 큐레이션 | 에이전트가 도구 호출을 통해 결정 — 예측 가능성은 모델별로 다름 | 사용자 제어: 완전한 CRUD, 카테고리, 중요도, 스코어링, 검색 |
| 최종 사용자 제품 | 없음 — 개발자 SDK / 프레임워크 + Letta Cloud 대시보드 | 예 — 채팅, 스트리밍, 도구, 파일 첨부가 있는 완전한 웹 앱 |
| AI 정체성 | 시스템 프롬프트 + 코어 메모리를 통한 에이전트 페르소나 | Soul Engine — XML 섹션 전반의 13개 버전 관리된 정체성 블록 |
| 크로스 도구 도달 범위 | 위에 구축하는 모든 것 — 즉시 MCP / VSCode 없음 | MCP(Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| 크리에이티브 도구 | 없음 | Pro 및 Max의 Image / Video / Music / Code 스튜디오 |
| 오픈 소스 | 예(Apache 2.0) | 아니요(호스팅된 SaaS) |
| 셀프 호스팅 | 예 | 아니요 |
| 가격 | 무료(셀프 호스팅) · Letta Cloud(유료 티어) | Starter $14/월 · Pro $29/월 · Max $99/월 |
Letta 셀프 호스팅은 엔지니어링 노력을 가져온다면 무료입니다: 서버, 데이터베이스, 배포, 모니터링, 업데이트. Letta Cloud는 사용량 기반 유료 티어가 있는 관리형 대안입니다. Alma의 가격은 고정되어 있고 최종 사용자 친화적입니다: Starter $14/월(무제한 메모리, Haiku + Sonnet), Pro $29/월(1M 토큰 컨텍스트의 Opus 4.7, 무제한 환경, 크리에이티브 스튜디오 추가), Max $99/월(REST API, MCP 서버, VSCode 확장 프로그램, SDK, BYOK 추가). 연간 청구는 모든 유료 플랜에서 "10개월 지불, 12개월 받기"입니다.
장기 실행 자율 에이전트 구축. 팀이 사람 개입 없이 여러 단계에 걸쳐 실행되는 AI 에이전트를 구축하고 있습니다 — 리서치 에이전트, 운영 에이전트, 다단계 자동화. Letta의 OS 스타일 계층 메모리(코어 / 아카이브 / 회상)는 정확히 이를 위해 설계되었습니다: 에이전트가 컨텍스트에 무엇이 남는지 자체 관리합니다. Alma의 사용자 제어 3-레이어 모델은 기본적으로 대화적입니다; SDK를 통해 자율 루프를 구동할 수 있지만 큐레이션 철학은 반대입니다 — 예측 가능, 노출됨, 에이전트가 아닌 사용자가 편집.
최종 사용자가 이미 사용하는 도구에서 메모리를 원함. Letta는 엔지니어링 팀을 위한 것입니다; 최종 사용자 제품이 없습니다. Alma는 최종 사용자 제품입니다. alma.olivares.ai에서 가입하고, 5분 안에 MCP 서버를 연결하면 지원되는 모든 AI 클라이언트(Claude Desktop, Cursor, Windsurf, Claude Code, VSCode)에 동일한 메모리가 있습니다. 사용자는 아카이브 메모리 페이징이나 회상 큐에 대해 생각할 필요가 없습니다; Alma가 검색을 자동으로 처리합니다.
오픈 소스, 셀프 호스팅 요구 사항. 팀이 모든 컴포넌트가 자체 인프라 내에서 감사 가능한 소스와 함께 실행되어야 한다는 엄격한 요구 사항을 가지고 있습니다. Letta가 올바른 선택입니다 — Apache 2.0, 전체 소스, 원하는 곳에서 실행하세요. Alma는 호스팅된 SaaS이며 셀프 호스팅이 필수일 때 올바른 도구가 아닙니다.
자율 AI 에이전트를 구축하는 경우 Letta를 선택하세요 — 장기 실행, 다단계, 사람 없이 결정을 내리는 에이전트 — 그리고 OS 스타일 계층 메모리 추상화가 문제에 깔끔하게 매핑되는 경우. 오픈 소스가 협상 불가이거나, 전체 스택을 셀프 호스팅하고 싶거나, 엔지니어링 팀이 프레임워크를 확장하고 운영할 대역폭이 있다면 Letta를 선택하세요. Letta의 연구 혈통(원래 MemGPT 논문)과 활발한 커뮤니티는 프레임워크를 맞춤 방향으로 밀어야 할 때 실제 자산입니다.
자율 에이전트를 위한 인프라를 구축하는 대신 메모리가 있는 AI를 사용하고 싶다면 Alma를 선택하세요. alma.olivares.ai에서 가입하고, 채팅을 시작하면 메모리가 작동합니다. Cursor, Claude Desktop, VSCode 또는 Windsurf에서도 작업한다면 MCP 서버(무료)를 설치하면 동일한 메모리가 사용자를 따라갑니다. 구조화되고 예측 가능한 AI 정체성(Soul Engine)을 원하거나, AI가 알고 있는 것에 대한 완전한 내보내기 및 편집 제어가 필요하거나, 번들된 크리에이티브 스튜디오를 원한다면 Alma를 선택하세요. 자신의 제품에 완전한 인지 레이어(memories + episodes + procedures + Soul + 스코어링된 컨텍스트 조립)를 원하는 개발자는 Max 플랜에서 SDK, MCP 서버, REST API를 얻습니다.
Letta의 계층 메모리와 Alma의 3-레이어 메모리는 동일한 것인가요? 아니요. Letta의 티어는 데이터가 컨텍스트 창에 상대적으로 어디에 있는지(코어 / 아카이브 / 회상)를 설명합니다. Alma의 레이어는 그것이 어떤 종류의 지식인지(사실 / 이벤트 / 워크플로)를 설명합니다. 다른 축, 다른 큐레이션 모델.
Alma는 자율 에이전트로 실행할 수 있나요? Letta의 의미로는 네이티브하지 않습니다 — Alma의 채팅은 대화적이며, 사용자가 각 턴을 구동합니다. 메모리는 그러한 대화에서 누적됩니다. 완전한 자율 에이전트 루프를 원한다면 Alma SDK / API 위에 구축하세요; Alma는 인지 레이어를 제공하고, 사용자가 에이전트 루프를 구축합니다.
Alma는 오픈 소스인가요? 아니요. Alma는 호스팅된 SaaS입니다. Letta는 Apache 2.0 하에 오픈 소스이며 오픈 소스가 엄격한 요구 사항이라면 올바른 선택입니다.
Letta 메모리를 Alma로 마이그레이션할 수 있나요? 오늘날 원클릭 가져오기를 통해서는 아닙니다. 모양 차이(Letta 티어 vs Alma 타입 레이어)는 구조화된 변환이 필요함을 의미합니다. Max의 REST API는 Letta 아카이브 저장소가 있고 가져오고 싶다면 가져오기를 직접 작성할 수 있게 합니다.
플랜 보기 · 플랜 보기 · 개발자 문서 및 SDK