अप्रैल 2026 · 10 मिनट पढ़ाई · Fran Olivares, Founder of OlivaresAI
@olivaresai/alma-mcp जैसा MCP server पाँच मिनट में install करें — कोई code नहीं; LLM call से पहले context fetch करने और बाद में memories extract करने के लिए JavaScript SDK का उपयोग करें; या किसी भी language से सीधे REST API call करें। तीनों ही एक ही Alma memory layer से जुड़ते हैं।हर AI बातचीत शून्य से शुरू होती है। आपका assistant आपका नाम, आपकी परियोजना, आपकी प्राथमिकताएँ — हर बार भूल जाता है। यह stateless AI की मूलभूत सीमा है, और यही सबसे बड़ा कारण है जिसकी वजह से AI एक सहयोगी की बजाय एक उपकरण की तरह महसूस होता है। यह guide आपको इसे हल करने के तीन ठोस तरीकों से ले जाएगी, zero-code setup से लेकर पूर्ण API integration तक।
जब आप ChatGPT, Claude, या कोई भी AI chat उपयोग करते हैं, तो बातचीत समाप्त होने पर context गायब हो जाता है। आप एक ही बातें बार-बार समझाते हैं: अपना tech stack, अपनी coding शैली, अपनी project architecture, अपनी प्राथमिकताएँ। यह समय बर्बाद करता है और बदतर परिणाम देता है क्योंकि AI कभी भी इसकी गहरी समझ नहीं बनाता कि आप कौन हैं या आप किस पर काम कर रहे हैं।
Platform-native memory features (ChatGPT Memory, Claude Projects) मदद करते हैं, लेकिन वे क्षमता में सीमित हैं, एक ही platform तक सीमित हैं, और कोई developer API नहीं देते। यदि आप AI-powered product बना रहे हैं, तो आपको एक स्वतंत्र memory layer चाहिए।
Model Context Protocol (MCP) सबसे तेज़ रास्ता है। यदि आपका AI Claude Desktop, Cursor, Windsurf, Claude Code, या किसी भी MCP-compatible client में चलता है, तो आप 5 मिनट से कम में persistent memory जोड़ सकते हैं।
Step 1: alma.olivares.ai पर sign up करें और Settings में एक API key बनाएँ।
Step 2: अपने MCP client config में अपनी API key के साथ @olivaresai/alma-mcp जोड़ें। Claude Desktop के लिए, claude_desktop_config.json edit करें। Cursor के लिए, MCP settings panel का उपयोग करें।
Step 3: अपना client restart करें। Server 35 tools उजागर करता है: alma_remember (एक memory save करें), alma_recall (memories खोजें), alma_assemble (सभी memory layers से context बनाएँ), alma_extract (text से facts निकालें), और बहुत कुछ। आपका AI अब एक persistent memory store से पढ़ सकता है और उसमें लिख सकता है जो हर बातचीत के पार जीवित रहता है।
MCP व्यक्तिगत workflows के लिए आदर्श है — सामान्य AI काम के लिए Claude Desktop, coding के लिए Cursor, terminal-based development के लिए Claude Code। एक memory, हर जगह।
JavaScript SDK (@olivaresai/alma-sdk) आपको custom applications के लिए पूर्ण programmatic नियंत्रण देता है। core integration pattern तीन steps का है:
client.context.assemble({ query }) call करें।client.memories.extract({ text }) call करें। या client.memories.create() के साथ सीधे memories बनाएँ।SDK पूर्ण TypeScript types के साथ सभी 140+ API endpoints को wrap करता है। npm install @olivaresai/alma-sdk के साथ install करें। यह केवल ESM है और Node.js 18+ की आवश्यकता है।
REST API किसी भी language या platform से सीधे HTTP access प्रदान करता है। मुख्य endpoints:
POST /api/v1/context/assemble — memories, episodes, procedures, और soul blocks से एक context prompt बनाएँPOST /api/v1/memories — content, category, importance, और confidence के साथ एक memory बनाएँGET /api/v1/memories/search?q=query&mode=hybrid — Hybrid semantic + keyword searchPOST /api/v1/memories/extract — text से facts का LLM-powered extractionPOST /api/v1/blocks — AI identity के लिए Soul Engine blocks configure करेंAuthentication API key (X-API-Key header) के माध्यम से है। Base URL: https://alma.olivares.ai/api/v1।
Alma की three-layer architecture ज्ञान को तीन प्रकारों में अलग करती है:
जब आप एक बातचीत शुरू करते हैं, context assembly hybrid search का उपयोग करके तीनों layers में खोज करता है, परिणामों को प्रासंगिकता (50%), importance (15%), confidence (15%), recency (10%), और frequency (10%) के अनुसार score करता है, फिर top-ranked context को system prompt में inject करता है — सब 100ms से कम में।
Memories हर 4 messages पर बातचीत से अपने आप extract होती हैं। extractor Claude Haiku का उपयोग करके प्रति बातचीत 0-30 facts पहचानता है। Duplicates Jaccard similarity (60% threshold) के माध्यम से पहचाने जाते हैं और merge किए जाते हैं। कम importance वाली पुरानी memories 120 दिनों की निष्क्रियता के बाद expire हो जाती हैं।
अकेले memory आपके AI को facts देती है। Soul Engine इसे identity देता है। संरचित blocks configure करें — व्यक्तित्व, विशेषज्ञता, संवाद शैली, नियम, और context — जो हर बातचीत में बने रहते हैं। एक single system prompt के विपरीत जो लंबी बातचीत में diluted हो जाता है, Soul Engine blocks versioned, organized, और हमेशा प्राथमिकता के साथ inject किए जाते हैं।
Environments आपको memory contexts को isolate करने देते हैं। कार्य, व्यक्तिगत, और client-specific memories को पूरी तरह से अलग रखें। प्रत्येक environment की अपनी memories, episodes, procedures, और soul blocks होती हैं। जब आप environments switch करते हैं, AI व्यक्तित्व और ज्ञान बदल देता है।
alma.olivares.ai पर शुरू करें। Starter plan ($14/month) में $2 weekly AI budget पर unlimited memories, 1 environment, और पूर्ण chat access शामिल है। सभी integration तरीके — MCP, SDK, API — हर plan पर काम करते हैं।
अधिक गहराई के लिए: AI Memory Management: Complete Guide 2026 · Building AI Assistants That Remember Everything · Persistent Memory vs RAG