अद्यतन मई 2026
Letta MemGPT का production-grade evolution है, 2023 का research paper जिसने प्रस्ताव दिया कि LLM के context window को RAM के OS analogue के रूप में मानें और कम-relevant तथ्यों को swap in और out करने के लिए "memory paging" का उपयोग करें। Framework Apache 2.0 के तहत open-source ship होता है और autonomous AI agents बनाने वाली engineering teams के लिए designed है — agents जो loop में बिना human के कई चरणों में कार्य करते हैं, जो सत्रों में state maintain करते हैं, और जिन्हें अपनी स्वयं की memory के बारे में reason करने की आवश्यकता है।
Letta की tiered memory की तीन परतें हैं: core memory (हमेशा संदर्भ में, agent स्वयं tool calls के माध्यम से संपादित), archival memory (vector-searchable, agent-queried) और recall memory (पूर्ण बातचीत इतिहास)। Defining trait self-management है: agent तय करता है कि क्या core में promoted होता है, क्या archived होता है, क्या भूला जाता है। Letta Cloud (paid hosted tier) और agents बनाने और testing के लिए एक developer-focused web UI भी है।
Alma end users और developers के लिए एक पूर्ण persistent memory उत्पाद है। End users alma.olivares.ai पर साइन अप करते हैं, Anthropic Claude (Haiku, Sonnet, Opus 4.7 1M-token संदर्भ के साथ) के साथ चैट करते हैं और memory layer स्वचालित रूप से तथ्य, प्राथमिकताएँ और निर्णय capture करती है। Soul Engine पहचान संभालता है। Image, Video, Music और Code studios bundled हैं। Developers भी MCP server, JavaScript SDK और Max plan पर REST API के माध्यम से उसी memory तक पहुँच सकते हैं।
Memory को तीन परतों में संरचित किया गया है (memories / episodes / procedures), प्रत्येक typed, प्रत्येक अलग तरीके से retrieved। Paid plans $14/mo (Starter) से शुरू होते हैं Soul Engine पूर्ण के साथ unlimited memories के साथ।
दोनों की तीन परतें हैं, लेकिन philosophy विपरीत है। Letta की tiers इस बारे में हैं कि context window के सापेक्ष data कहाँ रहता है — core (हमेशा में), archival (एक tool call दूर), recall (सभी इतिहास)। Agent built-in tools का उपयोग करके tiers के बीच data move करता है।
Alma की परतें इस बारे में हैं कि यह किस प्रकार का ज्ञान है — memories (तथ्य), episodes (घटनाएँ), procedures (workflows)। प्रत्येक परत के अपने retrieval और lifecycle नियम हैं। User किसी भी परत में कुछ भी पढ़, संपादित, score और हटा सकता है। Context assembly प्रत्येक चैट से पहले उन्हें system prompt में compose करता है — user को इसके बारे में सोचने की आवश्यकता नहीं है, लेकिन वे सब कुछ inspect कर सकते हैं।
नियंत्रण axis सबसे अधिक मायने रखती है। Letta agent-managed है: LLM स्वयं curator है। यह autonomous agents के लिए शक्तिशाली है लेकिन predict करना कठिन — आपका agent तय कर सकता है कि आपकी stack वरीयता unimportant है और इसे archive कर दे। Alma user-controlled है: importance, confidence, category और पूर्ण CRUD user के हाथों में रहते हैं। Predictable, debuggable, exportable।
Letta autonomous AI agents बनाने वाली engineering teams के लिए है — उत्पाद जहाँ AI loop में बिना human के चलती है, निर्णय लेती है, और लंबे horizons पर coherent रहने के लिए OS-style memory model की आवश्यकता है। Framework open source है इसलिए आप हर line पढ़ सकते हैं, fork कर सकते हैं और self-host कर सकते हैं।
Alma उन end users के लिए है जो उन tools में memory के साथ AI चाहते हैं जिनमें वे पहले से काम करते हैं — Cursor, Claude Desktop, VSCode, Windsurf, Alma web app — और उन developers के लिए जो स्वयं एक लिखे बिना अपने उत्पादों में embed करने के लिए एक पूर्ण cognitive layer चाहते हैं। Trade-off closed-source SaaS है, लेकिन इसके साथ आने वाली speed और stability के साथ।
| सुविधा | Letta (MemGPT) | Alma |
|---|---|---|
| Target user | autonomous AI agents बनाने वाले Developers | End users + developers |
| Memory model | स्थान के अनुसार Tiered: core + archival + recall (agent-managed) | आकार के अनुसार Typed: memories + episodes + procedures (user-controlled) |
| Memory curation | Agent tool calls के माध्यम से तय करता है — predictability model के अनुसार बदलती है | User नियंत्रित करता है: पूर्ण CRUD, categories, importance, scoring, search |
| End-user उत्पाद | नहीं — developer SDK / framework + Letta Cloud dashboard | हाँ — chat, streaming, tools, file attachments के साथ पूर्ण web app |
| AI पहचान | system prompt + core memory के माध्यम से Agent persona | Soul Engine — XML sections में 13 versioned identity blocks |
| Cross-tool पहुँच | जो भी आप ऊपर बनाते हैं — कोई MCP / VSCode out of the box नहीं | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Creative tools | कोई नहीं | Pro और Max में Image / Video / Music / Code studios |
| Open source | हाँ (Apache 2.0) | नहीं (hosted SaaS) |
| Self-host | हाँ | नहीं |
| मूल्य | मुफ़्त (self-hosted) · Letta Cloud (paid tiers) | Starter $14/mo · Pro $29/mo · Max $99/mo |
Letta self-hosted मुफ़्त है यदि आप engineering effort लाते हैं: एक server, एक database, deployment, monitoring, updates। Letta Cloud managed विकल्प है usage पर आधारित paid tiers के साथ। Alma का pricing fixed और end-user-friendly है: Starter $14/mo (unlimited memories, Haiku + Sonnet), Pro $29/mo (1M-token संदर्भ के साथ Opus 4.7, unlimited environments और creative studios जोड़ता है), Max $99/mo (REST API, MCP server, VSCode extension, SDK और BYOK जोड़ता है)। हर paid plan पर वार्षिक बिलिंग "10 महीने pay करें, 12 प्राप्त करें" है।
एक long-running autonomous agent का निर्माण। एक team एक AI agent बना रही है जो human intervention के बिना कई चरणों में चलती है — research agents, ops agents, multi-step automation। Letta में OS-style tiered memory (core / archival / recall) ठीक इसके लिए designed है: agent self-manages क्या संदर्भ में रहता है। Alma का user-controlled 3-layer model डिफ़ॉल्ट रूप से conversational है; यह SDK के माध्यम से एक autonomous loop drive कर सकता है, लेकिन curation philosophy विपरीत है — predictable, exposed, agent के बजाय user द्वारा संपादित।
End-user उन tools में memory चाहता है जिन्हें वे पहले से उपयोग करते हैं। Letta engineering teams के लिए है; कोई end-user उत्पाद नहीं है। Alma end-user उत्पाद है। alma.olivares.ai पर साइन अप करें, पाँच मिनट में MCP server कनेक्ट करें, और हर supported AI क्लाइंट (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) के पास वही memory है। User कभी archival memory paging या recall queues के बारे में नहीं सोचता; Alma retrieval स्वचालित रूप से संभालता है।
Open-source, self-host आवश्यकता। एक team के पास एक hard requirement है कि सभी components auditable source के साथ अपनी infrastructure के अंदर चलें। Letta सही विकल्प है — Apache 2.0, पूर्ण source, इसे जहाँ चाहें चलाएँ। Alma एक hosted SaaS है और सही tool नहीं है जब self-hosting mandatory है।
Letta चुनें यदि आप autonomous AI agents बना रहे हैं — long-running, multi-step, makes-decisions-without-a-human agents — और OS-style tiered memory abstraction आपकी समस्या पर साफ़-साफ़ map होती है। Letta चुनें यदि open source non-negotiable है, यदि आप पूरी stack self-host करना चाहते हैं, या यदि आपकी engineering team के पास framework को विस्तार और operate करने की bandwidth है। Letta का research lineage (original MemGPT paper) और active community वास्तविक assets हैं जब आपको framework को custom directions में push करने की आवश्यकता है।
Alma चुनें यदि आप autonomous agents के लिए infrastructure बनाने के बजाय memory के साथ AI का उपयोग करना चाहते हैं। alma.olivares.ai पर साइन अप करें, चैट शुरू करें, और memory काम करती है। यदि आप Cursor, Claude Desktop, VSCode या Windsurf में भी काम करते हैं, MCP server (मुफ़्त) स्थापित करें और वही memory आपका अनुसरण करती है। Alma चुनें यदि आप एक संरचित, predictable AI पहचान (Soul Engine) चाहते हैं, यदि आपको पूर्ण निर्यात और संपादन नियंत्रण चाहिए कि AI क्या जानती है, या यदि आप bundled creative studios चाहते हैं। Developers जो अपने स्वयं के उत्पाद में एक पूर्ण cognitive layer (memories + episodes + procedures + Soul + scored context assembly) चाहते हैं उन्हें Max plan पर SDK, MCP server और REST API मिलते हैं।
क्या Letta की tiered memory और Alma की 3-layer memory एक ही चीज़ हैं? नहीं। Letta की tiers describe करती हैं कि context window के सापेक्ष data कहाँ रहता है (core / archival / recall)। Alma की परतें describe करती हैं कि यह किस प्रकार का ज्ञान है (तथ्य / घटनाएँ / workflows)। Different axes, different curation models।
क्या Alma एक autonomous agent के रूप में चल सकता है? Letta sense में natively नहीं — Alma की chat conversational है, user हर turn drive करता है। Memory उन बातचीतों से जमा होती है। यदि आप एक पूरी तरह autonomous agent loop चाहते हैं, इसे Alma SDK / API पर बनाएँ; Alma आपको cognitive layer देता है, आप agent loop बनाते हैं।
क्या Alma open source है? नहीं। Alma एक hosted SaaS है। Letta Apache 2.0 के तहत open source है और सही विकल्प है यदि open source एक hard requirement है।
क्या मैं अपनी Letta memories को Alma में migrate कर सकता हूँ? आज एक one-click import के माध्यम से नहीं। Shape अंतर (Letta tiers vs Alma typed layers) का अर्थ है कि इसे एक संरचित conversion की आवश्यकता है। यदि आपके पास एक Letta archival store है और इसे लाना चाहते हैं तो Max पर REST API आपको स्वयं import लिखने देता है।