फरवरी 2026 · 7 min read · Developer tutorial
AI एक commodity है। हर platform सहायकों का वादा करता है। अंतर वह नहीं है जो मॉडल कह सकता है — यह वह है जो वह आपके बारे में जानता है। यह guide उन developers के लिए है जो एक AI app बनाना चाहते हैं जो users को याद रखे, और tooling और architecture निर्णयों को कवर करती है जो आपको जल्दी ship करने देते हैं।
तीन प्रकार: (1) तथ्य और प्राथमिकताएँ (memories) — "user gravitational waves के बारे में सीख रहा है"। (2) घटनाएँ और timelines (episodes) — "3 मार्च को, user ने Python पर Rust चुना"। (3) workflows और patterns (procedures) — "जब user एक bug रिपोर्ट करता है, पहले logs के लिए पूछें"।
क्यों ये तीन? क्योंकि वे retrieval-distinct हैं। तथ्य semantic search के साथ अच्छी तरह query होते हैं; events timestamps द्वारा queryable हैं; procedures trigger patterns द्वारा। उन्हें एक bucket में मिलाना कम-quality retrieval देता है।
एक 5-कारक रचना: relevance (50%), importance (15%), confidence (15%), recency (10%), frequency (10%)। Relevance हावी है क्योंकि सबसे relevant memory लगभग हमेशा सबसे recent वाली से बेहतर है। Confidence गलत निकाले गए तथ्यों के लिए एक brake है। Recency और frequency संबंध बनाते हैं लेकिन हावी नहीं होते।
ये weights प्रयोगात्मक रूप से calibrated हैं। यदि आप अलग weights चाहते हैं, सावधान रहें: एक 10% बदलाव आपके retrieval order को महत्वपूर्ण रूप से बदल सकता है। बेहतर है: weights रखें, और memory creation logic adjust करें।
Environments के साथ। प्रत्येक user अपना खाता प्राप्त करता है (तार्किक isolation), और प्रति-user आप कई environments रख सकते हैं (एक कार्य, एक व्यक्तिगत, एक client A, एक client B के लिए)। प्रत्येक environment में अपनी memories, episodes, procedures, और Soul blocks होती हैं।
इसका मतलब है कि एक एकल user एक AI सहायक के साथ कई contexts रख सकता है, बिना cross-contamination के। यदि वे कार्य environment में हैं, उन्हें वे memories नहीं मिलतीं जो उन्होंने व्यक्तिगत environment में बनाई थीं।
तीन paths: MCP, SDK, REST। MCP fastest है यदि आप Claude Desktop, Cursor, या Windsurf पर build कर रहे हैं — कोई कोड नहीं, बस एक config प्रविष्टि। SDK Node.js apps के लिए: npm install @olivaresai/alma-sdk। REST सब कुछ के लिए: HTTP requests किसी भी language से।
तीनों समान memory backend से कनेक्ट करते हैं। आप एक app MCP के माध्यम से और दूसरा SDK के माध्यम से बना सकते हैं — दोनों उसी memory account के against काम करते हैं।
यदि आप एक AI सहायक बना रहे हैं जिसमें एक सुसंगत persona होना चाहिए — एक brand voice, एक specific tone, domain expertise, hard constraints — तो हाँ। Soul Engine 13 versioned blocks उजागर करता है (पहचान, व्यक्तित्व, विशेषज्ञता, संचार शैली, नियम, संदर्भ, anti-patterns) जो हमेशा प्राथमिकता के साथ inject होते हैं।
केवल memory की तुलना में अंतर: memory "AI आपको जानती है"। Soul Engine "AI वह है जिसे आप उसे होना चाहते हैं"। एक साथ, वे आपको स्थिर पहचान + विकसित संदर्भ देते हैं।
Alma के साथ, extraction स्वचालित है। प्रत्येक 4 messages के बाद, सेवा एक background extraction चलाती है: Haiku 4.5 आपकी बातचीत पढ़ता है, तथ्य निकालता है (0-30 प्रति बातचीत), और उन्हें memories में बचाता है। आप कोई कोड नहीं लिखते — यह बस होता है। आप मैन्युअल रूप से एक extraction trigger कर सकते हैं REST API के माध्यम से या SDK में।
Alma Anthropic Claude (Haiku, Sonnet, Opus 4.7) का उपयोग करता है। आपके users अपने स्वयं के Alma खातों का उपयोग करते हैं (अपने स्वयं के subscriptions के साथ); आपकी app उनकी ओर से Alma को कॉल करती है। API access Max plan ($99/mo) पर शुरू होता है — आप अपने users को सीधे bill करते हैं या किसी बाहरी payment provider के साथ revenue share करते हैं।
अपना use case मानचित्र करें: MCP यदि आप Claude Desktop / Cursor / Windsurf पर हैं। SDK Node.js के लिए। REST सब कुछ के लिए। alma.olivares.ai पर एक test खाते के साथ साइन अप करें, अपना plan चुनें, और 5 मिनट में memory देखें।