Alma vs Letta (MemGPT)

अद्यतन मई 2026

Letta (पहले MemGPT) stateful AI agents बनाने के लिए एक open-source framework है। इसकी tiered memory (core / archival / recall) operating-system virtual memory से प्रेरित है: agent स्वयं तय करता है कि क्या याद रखना और भूलना है। Alma एक production SaaS है जहाँ user memory नियंत्रित करता है: 3-layer typed आर्किटेक्चर (memories / episodes / procedures), Soul Engine पहचान, पूर्ण UI, MCP server, creative studios।

Letta (MemGPT) क्या है?

Letta MemGPT का production-grade evolution है, 2023 का research paper जिसने प्रस्ताव दिया कि LLM के context window को RAM के OS analogue के रूप में मानें और कम-relevant तथ्यों को swap in और out करने के लिए "memory paging" का उपयोग करें। Framework Apache 2.0 के तहत open-source ship होता है और autonomous AI agents बनाने वाली engineering teams के लिए designed है — agents जो loop में बिना human के कई चरणों में कार्य करते हैं, जो सत्रों में state maintain करते हैं, और जिन्हें अपनी स्वयं की memory के बारे में reason करने की आवश्यकता है।

Letta की tiered memory की तीन परतें हैं: core memory (हमेशा संदर्भ में, agent स्वयं tool calls के माध्यम से संपादित), archival memory (vector-searchable, agent-queried) और recall memory (पूर्ण बातचीत इतिहास)। Defining trait self-management है: agent तय करता है कि क्या core में promoted होता है, क्या archived होता है, क्या भूला जाता है। Letta Cloud (paid hosted tier) और agents बनाने और testing के लिए एक developer-focused web UI भी है।

Alma क्या है?

Alma end users और developers के लिए एक पूर्ण persistent memory उत्पाद है। End users alma.olivares.ai पर साइन अप करते हैं, Anthropic Claude (Haiku, Sonnet, Opus 4.7 1M-token संदर्भ के साथ) के साथ चैट करते हैं और memory layer स्वचालित रूप से तथ्य, प्राथमिकताएँ और निर्णय capture करती है। Soul Engine पहचान संभालता है। Image, Video, Music और Code studios bundled हैं। Developers भी MCP server, JavaScript SDK और Max plan पर REST API के माध्यम से उसी memory तक पहुँच सकते हैं।

Memory को तीन परतों में संरचित किया गया है (memories / episodes / procedures), प्रत्येक typed, प्रत्येक अलग तरीके से retrieved। Paid plans $14/mo (Starter) से शुरू होते हैं Soul Engine पूर्ण के साथ unlimited memories के साथ।

memory आर्किटेक्चर पर वे कैसे भिन्न हैं?

दोनों की तीन परतें हैं, लेकिन philosophy विपरीत है। Letta की tiers इस बारे में हैं कि context window के सापेक्ष data कहाँ रहता है — core (हमेशा में), archival (एक tool call दूर), recall (सभी इतिहास)। Agent built-in tools का उपयोग करके tiers के बीच data move करता है।

Alma की परतें इस बारे में हैं कि यह किस प्रकार का ज्ञान है — memories (तथ्य), episodes (घटनाएँ), procedures (workflows)। प्रत्येक परत के अपने retrieval और lifecycle नियम हैं। User किसी भी परत में कुछ भी पढ़, संपादित, score और हटा सकता है। Context assembly प्रत्येक चैट से पहले उन्हें system prompt में compose करता है — user को इसके बारे में सोचने की आवश्यकता नहीं है, लेकिन वे सब कुछ inspect कर सकते हैं।

नियंत्रण axis सबसे अधिक मायने रखती है। Letta agent-managed है: LLM स्वयं curator है। यह autonomous agents के लिए शक्तिशाली है लेकिन predict करना कठिन — आपका agent तय कर सकता है कि आपकी stack वरीयता unimportant है और इसे archive कर दे। Alma user-controlled है: importance, confidence, category और पूर्ण CRUD user के हाथों में रहते हैं। Predictable, debuggable, exportable।

target user में वे कैसे भिन्न हैं?

Letta autonomous AI agents बनाने वाली engineering teams के लिए है — उत्पाद जहाँ AI loop में बिना human के चलती है, निर्णय लेती है, और लंबे horizons पर coherent रहने के लिए OS-style memory model की आवश्यकता है। Framework open source है इसलिए आप हर line पढ़ सकते हैं, fork कर सकते हैं और self-host कर सकते हैं।

Alma उन end users के लिए है जो उन tools में memory के साथ AI चाहते हैं जिनमें वे पहले से काम करते हैं — Cursor, Claude Desktop, VSCode, Windsurf, Alma web app — और उन developers के लिए जो स्वयं एक लिखे बिना अपने उत्पादों में embed करने के लिए एक पूर्ण cognitive layer चाहते हैं। Trade-off closed-source SaaS है, लेकिन इसके साथ आने वाली speed और stability के साथ।

सुविधा-दर-सुविधा तुलना

सुविधाLetta (MemGPT)Alma
Target userautonomous AI agents बनाने वाले DevelopersEnd users + developers
Memory modelस्थान के अनुसार Tiered: core + archival + recall (agent-managed)आकार के अनुसार Typed: memories + episodes + procedures (user-controlled)
Memory curationAgent tool calls के माध्यम से तय करता है — predictability model के अनुसार बदलती हैUser नियंत्रित करता है: पूर्ण CRUD, categories, importance, scoring, search
End-user उत्पादनहीं — developer SDK / framework + Letta Cloud dashboardहाँ — chat, streaming, tools, file attachments के साथ पूर्ण web app
AI पहचानsystem prompt + core memory के माध्यम से Agent personaSoul Engine — XML sections में 13 versioned identity blocks
Cross-tool पहुँचजो भी आप ऊपर बनाते हैं — कोई MCP / VSCode out of the box नहींMCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Creative toolsकोई नहींPro और Max में Image / Video / Music / Code studios
Open sourceहाँ (Apache 2.0)नहीं (hosted SaaS)
Self-hostहाँनहीं
मूल्यमुफ़्त (self-hosted) · Letta Cloud (paid tiers)Starter $14/mo · Pro $29/mo · Max $99/mo

मूल्य निर्धारण तुलना

Letta self-hosted मुफ़्त है यदि आप engineering effort लाते हैं: एक server, एक database, deployment, monitoring, updates। Letta Cloud managed विकल्प है usage पर आधारित paid tiers के साथ। Alma का pricing fixed और end-user-friendly है: Starter $14/mo (unlimited memories, Haiku + Sonnet), Pro $29/mo (1M-token संदर्भ के साथ Opus 4.7, unlimited environments और creative studios जोड़ता है), Max $99/mo (REST API, MCP server, VSCode extension, SDK और BYOK जोड़ता है)। हर paid plan पर वार्षिक बिलिंग "10 महीने pay करें, 12 प्राप्त करें" है।

व्यवहार में सामान्य workflows

एक long-running autonomous agent का निर्माण। एक team एक AI agent बना रही है जो human intervention के बिना कई चरणों में चलती है — research agents, ops agents, multi-step automation। Letta में OS-style tiered memory (core / archival / recall) ठीक इसके लिए designed है: agent self-manages क्या संदर्भ में रहता है। Alma का user-controlled 3-layer model डिफ़ॉल्ट रूप से conversational है; यह SDK के माध्यम से एक autonomous loop drive कर सकता है, लेकिन curation philosophy विपरीत है — predictable, exposed, agent के बजाय user द्वारा संपादित।

End-user उन tools में memory चाहता है जिन्हें वे पहले से उपयोग करते हैं। Letta engineering teams के लिए है; कोई end-user उत्पाद नहीं है। Alma end-user उत्पाद है। alma.olivares.ai पर साइन अप करें, पाँच मिनट में MCP server कनेक्ट करें, और हर supported AI क्लाइंट (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) के पास वही memory है। User कभी archival memory paging या recall queues के बारे में नहीं सोचता; Alma retrieval स्वचालित रूप से संभालता है।

Open-source, self-host आवश्यकता। एक team के पास एक hard requirement है कि सभी components auditable source के साथ अपनी infrastructure के अंदर चलें। Letta सही विकल्प है — Apache 2.0, पूर्ण source, इसे जहाँ चाहें चलाएँ। Alma एक hosted SaaS है और सही tool नहीं है जब self-hosting mandatory है।

मुझे Letta कब चुनना चाहिए?

Letta चुनें यदि आप autonomous AI agents बना रहे हैं — long-running, multi-step, makes-decisions-without-a-human agents — और OS-style tiered memory abstraction आपकी समस्या पर साफ़-साफ़ map होती है। Letta चुनें यदि open source non-negotiable है, यदि आप पूरी stack self-host करना चाहते हैं, या यदि आपकी engineering team के पास framework को विस्तार और operate करने की bandwidth है। Letta का research lineage (original MemGPT paper) और active community वास्तविक assets हैं जब आपको framework को custom directions में push करने की आवश्यकता है।

मुझे Alma कब चुनना चाहिए?

Alma चुनें यदि आप autonomous agents के लिए infrastructure बनाने के बजाय memory के साथ AI का उपयोग करना चाहते हैं। alma.olivares.ai पर साइन अप करें, चैट शुरू करें, और memory काम करती है। यदि आप Cursor, Claude Desktop, VSCode या Windsurf में भी काम करते हैं, MCP server (मुफ़्त) स्थापित करें और वही memory आपका अनुसरण करती है। Alma चुनें यदि आप एक संरचित, predictable AI पहचान (Soul Engine) चाहते हैं, यदि आपको पूर्ण निर्यात और संपादन नियंत्रण चाहिए कि AI क्या जानती है, या यदि आप bundled creative studios चाहते हैं। Developers जो अपने स्वयं के उत्पाद में एक पूर्ण cognitive layer (memories + episodes + procedures + Soul + scored context assembly) चाहते हैं उन्हें Max plan पर SDK, MCP server और REST API मिलते हैं।

अक्सर पूछे जाने वाले प्रश्न

क्या Letta की tiered memory और Alma की 3-layer memory एक ही चीज़ हैं? नहीं। Letta की tiers describe करती हैं कि context window के सापेक्ष data कहाँ रहता है (core / archival / recall)। Alma की परतें describe करती हैं कि यह किस प्रकार का ज्ञान है (तथ्य / घटनाएँ / workflows)। Different axes, different curation models।

क्या Alma एक autonomous agent के रूप में चल सकता है? Letta sense में natively नहीं — Alma की chat conversational है, user हर turn drive करता है। Memory उन बातचीतों से जमा होती है। यदि आप एक पूरी तरह autonomous agent loop चाहते हैं, इसे Alma SDK / API पर बनाएँ; Alma आपको cognitive layer देता है, आप agent loop बनाते हैं।

क्या Alma open source है? नहीं। Alma एक hosted SaaS है। Letta Apache 2.0 के तहत open source है और सही विकल्प है यदि open source एक hard requirement है।

क्या मैं अपनी Letta memories को Alma में migrate कर सकता हूँ? आज एक one-click import के माध्यम से नहीं। Shape अंतर (Letta tiers vs Alma typed layers) का अर्थ है कि इसे एक संरचित conversion की आवश्यकता है। यदि आपके पास एक Letta archival store है और इसे लाना चाहते हैं तो Max पर REST API आपको स्वयं import लिखने देता है।

योजनाएँ देखें · योजनाएँ देखें · Developer docs और SDK

See plans