क्या मुझे AI सहायक बनाने के लिए एक डेटाबेस बनाने की आवश्यकता है?

नहीं। Alma एक hosted memory layer है। आप MCP, SDK, या REST API के माध्यम से जुड़ते हैं — स्टोरेज, indexing, और retrieval हमारे लिए चलते हैं। आप memory model नहीं, अपनी app पर ध्यान केंद्रित करते हैं।

मुझे कब memories vs episodes vs procedures का उपयोग करना चाहिए?

Memories: स्थिर तथ्य और प्राथमिकताएँ ("उपयोगकर्ता काली कॉफी पसंद करता है")। Episodes: बातचीत सारांश और timelines ("3 अप्रैल को, उपयोगकर्ता ने Y के बजाय X तय किया")। Procedures: workflows और patterns ("Z परिदृश्य का सामना करने पर, इन चरणों का पालन करें")।

सबसे सरल एकीकरण क्या है?

MCP, यदि आपकी app Claude Desktop, Cursor, Windsurf, या Claude Code पर बनी है। शून्य कोड — बस एक कॉन्फिग प्रविष्टि और एक API key। SDK Node.js custom apps के लिए। REST सब कुछ के लिए।

क्या मैं Alma पर बनी एक app बेच सकता हूँ?

हाँ। आपके उपयोगकर्ता अपने स्वयं के Alma खातों का उपयोग करते हैं (अपने स्वयं के सब्सक्रिप्शन और बजट के साथ)। आपकी app उनकी ओर से Alma को कॉल करती है। Max plan ($99/mo) API access और MCP server distribution अनलॉक करता है।

AI सहायक बनाना जो सब कुछ याद रखते हैं

फरवरी 2026 · 7 min read · Developer tutorial

persistent memory के साथ AI सहायकों का निर्माण इस बारे में है कि क्या याद रखना है, इसे कैसे संरचना देना है, और इसे संदर्भ में कैसे लाना है। यह guide तीन आर्किटेक्चर निर्णयों (memories vs episodes vs procedures, scoring weights, environment isolation) को कवर करती है, फिर तीन एकीकरण paths दिखाती है: MCP server (कोई कोड नहीं), JavaScript SDK (custom Node.js), REST API (किसी भी language)।

AI एक commodity है। हर platform सहायकों का वादा करता है। अंतर वह नहीं है जो मॉडल कह सकता है — यह वह है जो वह आपके बारे में जानता है। यह guide उन developers के लिए है जो एक AI app बनाना चाहते हैं जो users को याद रखे, और tooling और architecture निर्णयों को कवर करती है जो आपको जल्दी ship करने देते हैं।

मुझे क्या याद रखना चाहिए?

तीन प्रकार: (1) तथ्य और प्राथमिकताएँ (memories) — "user gravitational waves के बारे में सीख रहा है"। (2) घटनाएँ और timelines (episodes) — "3 मार्च को, user ने Python पर Rust चुना"। (3) workflows और patterns (procedures) — "जब user एक bug रिपोर्ट करता है, पहले logs के लिए पूछें"।

क्यों ये तीन? क्योंकि वे retrieval-distinct हैं। तथ्य semantic search के साथ अच्छी तरह query होते हैं; events timestamps द्वारा queryable हैं; procedures trigger patterns द्वारा। उन्हें एक bucket में मिलाना कम-quality retrieval देता है।

मैं scoring को कैसे priority दूँ?

एक 5-कारक रचना: relevance (50%), importance (15%), confidence (15%), recency (10%), frequency (10%)। Relevance हावी है क्योंकि सबसे relevant memory लगभग हमेशा सबसे recent वाली से बेहतर है। Confidence गलत निकाले गए तथ्यों के लिए एक brake है। Recency और frequency संबंध बनाते हैं लेकिन हावी नहीं होते।

ये weights प्रयोगात्मक रूप से calibrated हैं। यदि आप अलग weights चाहते हैं, सावधान रहें: एक 10% बदलाव आपके retrieval order को महत्वपूर्ण रूप से बदल सकता है। बेहतर है: weights रखें, और memory creation logic adjust करें।

मैं user contexts को कैसे अलग करूँ?

Environments के साथ। प्रत्येक user अपना खाता प्राप्त करता है (तार्किक isolation), और प्रति-user आप कई environments रख सकते हैं (एक कार्य, एक व्यक्तिगत, एक client A, एक client B के लिए)। प्रत्येक environment में अपनी memories, episodes, procedures, और Soul blocks होती हैं।

इसका मतलब है कि एक एकल user एक AI सहायक के साथ कई contexts रख सकता है, बिना cross-contamination के। यदि वे कार्य environment में हैं, उन्हें वे memories नहीं मिलतीं जो उन्होंने व्यक्तिगत environment में बनाई थीं।

मैं इसे अपने app में कैसे ship करूँ?

तीन paths: MCP, SDK, REST। MCP fastest है यदि आप Claude Desktop, Cursor, या Windsurf पर build कर रहे हैं — कोई कोड नहीं, बस एक config प्रविष्टि। SDK Node.js apps के लिए: npm install @olivaresai/alma-sdk। REST सब कुछ के लिए: HTTP requests किसी भी language से।

तीनों समान memory backend से कनेक्ट करते हैं। आप एक app MCP के माध्यम से और दूसरा SDK के माध्यम से बना सकते हैं — दोनों उसी memory account के against काम करते हैं।

मुझे क्या Soul Engine चाहिए?

यदि आप एक AI सहायक बना रहे हैं जिसमें एक सुसंगत persona होना चाहिए — एक brand voice, एक specific tone, domain expertise, hard constraints — तो हाँ। Soul Engine 13 versioned blocks उजागर करता है (पहचान, व्यक्तित्व, विशेषज्ञता, संचार शैली, नियम, संदर्भ, anti-patterns) जो हमेशा प्राथमिकता के साथ inject होते हैं।

केवल memory की तुलना में अंतर: memory "AI आपको जानती है"। Soul Engine "AI वह है जिसे आप उसे होना चाहते हैं"। एक साथ, वे आपको स्थिर पहचान + विकसित संदर्भ देते हैं।

मैं extraction को कैसे automate करूँ?

Alma के साथ, extraction स्वचालित है। प्रत्येक 4 messages के बाद, सेवा एक background extraction चलाती है: Haiku 4.5 आपकी बातचीत पढ़ता है, तथ्य निकालता है (0-30 प्रति बातचीत), और उन्हें memories में बचाता है। आप कोई कोड नहीं लिखते — यह बस होता है। आप मैन्युअल रूप से एक extraction trigger कर सकते हैं REST API के माध्यम से या SDK में।

कौन सी मॉडल और मूल्य निर्धारण?

Alma Anthropic Claude (Haiku, Sonnet, Opus 4.7) का उपयोग करता है। आपके users अपने स्वयं के Alma खातों का उपयोग करते हैं (अपने स्वयं के subscriptions के साथ); आपकी app उनकी ओर से Alma को कॉल करती है। API access Max plan ($99/mo) पर शुरू होता है — आप अपने users को सीधे bill करते हैं या किसी बाहरी payment provider के साथ revenue share करते हैं।

मुझे आज क्या करना चाहिए?

अपना use case मानचित्र करें: MCP यदि आप Claude Desktop / Cursor / Windsurf पर हैं। SDK Node.js के लिए। REST सब कुछ के लिए। alma.olivares.ai पर एक test खाते के साथ साइन अप करें, अपना plan चुनें, और 5 मिनट में memory देखें।

See plans