April 2026 · 10 min leestijd · Fran Olivares, oprichter van OlivaresAI
@olivaresai/alma-mcp in uw clientconfiguratie — geen code; gebruik de JavaScript SDK om context op te halen vóór LLM-aanroepen en herinneringen erna te extraheren; of roep de REST API direct aan vanuit elke taal. Alle drie verbinden met dezelfde Alma-geheugenlaag.Elk AI-gesprek begint vanaf nul. Uw assistent vergeet uw naam, uw project, uw voorkeuren — telkens weer. Dit is de fundamentele beperking van stateless AI, en de grootste reden waarom AI aanvoelt als een tool in plaats van een collaborateur. Deze gids leidt u door drie concrete benaderingen om dit op te lossen, van installatie zonder code tot volledige API-integratie.
Wanneer u ChatGPT, Claude of een andere AI-chat gebruikt, verdwijnt de context wanneer het gesprek eindigt. U legt steeds weer dezelfde dingen uit: uw tech stack, uw codeerstijl, uw projectarchitectuur, uw voorkeuren. Dit verspilt tijd en levert slechtere resultaten op omdat de AI nooit een diep begrip opbouwt van wie u bent of waar u aan werkt.
Platformgebonden geheugenfuncties (ChatGPT Memory, Claude Projects) helpen, maar zijn beperkt in capaciteit, gebonden aan één platform en bieden geen ontwikkelaars-API. Als u een AI-gestuurd product bouwt, hebt u een onafhankelijke geheugenlaag nodig.
Het Model Context Protocol (MCP) is de snelste weg. Als uw AI draait in Claude Desktop, Cursor, Windsurf, Claude Code of een MCP-compatibele client, kunt u in minder dan 5 minuten permanent geheugen toevoegen.
Stap 1: Registreer u op alma.olivares.ai en genereer een API-sleutel in Instellingen.
Stap 2: Voeg @olivaresai/alma-mcp toe aan uw MCP-clientconfiguratie met uw API-sleutel. Bewerk voor Claude Desktop claude_desktop_config.json. Gebruik in Cursor het MCP-instellingenpaneel.
Stap 3: Herstart uw client. De server biedt 35 tools: alma_remember (sla een herinnering op), alma_recall (zoek herinneringen), alma_assemble (bouw context uit alle geheugenlagen), alma_extract (extraheer feiten uit tekst) en meer. Uw AI kan nu lezen uit en schrijven naar een permanente geheugenopslag die elk toekomstig gesprek overleeft.
MCP is ideaal voor persoonlijke workflows — Claude Desktop voor algemeen AI-werk, Cursor voor coderen, Claude Code voor terminalgebaseerde ontwikkeling. Eén geheugen, overal.
De JavaScript SDK (@olivaresai/alma-sdk) geeft u volledige programmatische controle voor aangepaste toepassingen. Het kernintegratiepatroon heeft drie stappen:
client.context.assemble({ query }) aan om een systeemprompt te krijgen die is verrijkt met relevante herinneringen, episodes, procedures en Soul-blokken.client.memories.extract({ text }) aan om nieuwe feiten uit het gesprek op te slaan. Of maak herinneringen direct aan met client.memories.create().De SDK wikkelt alle 140+ API-eindpunten met volledige TypeScript-typen. Installeer met npm install @olivaresai/alma-sdk. Het is alleen ESM en vereist Node.js 18+.
De REST API biedt directe HTTP-toegang vanuit elke taal of platform. Belangrijkste eindpunten:
POST /api/v1/context/assemble — Bouw een contextprompt op uit herinneringen, episodes, procedures en Soul-blokkenPOST /api/v1/memories — Maak een herinnering aan met inhoud, categorie, belangrijkheid en vertrouwenGET /api/v1/memories/search?q=query&mode=hybrid — Hybride semantisch + keyword zoekenPOST /api/v1/memories/extract — Op LLM gebaseerde extractie van feiten uit tekstPOST /api/v1/blocks — Configureer Soul Engine-blokken voor AI-identiteitAuthenticatie gaat via een API-sleutel (X-API-Key-header). Basis-URL: https://alma.olivares.ai/api/v1.
De drielaagse architectuur van Alma verdeelt kennis in drie typen:
Wanneer u een gesprek begint, doorzoekt contextsamenstelling alle drie de lagen met hybride zoeken, scoort de resultaten op relevantie (50%), belangrijkheid (15%), vertrouwen (15%), recentheid (10%) en frequentie (10%) en injecteert vervolgens de hoogst gerangschikte context in de systeemprompt — alles in minder dan 100 ms.
Herinneringen worden automatisch elke 4 berichten uit gesprekken gehaald. De extractor identificeert 0–30 feiten per gesprek met Claude Haiku. Duplicaten worden gedetecteerd via Jaccard-similariteit (60% drempel) en samengevoegd. Verouderde herinneringen met lage belangrijkheid verlopen na 120 dagen inactiviteit.
Geheugen alleen geeft uw AI feiten. De Soul Engine geeft hem identiteit. Configureer gestructureerde blokken — persoonlijkheid, expertise, communicatiestijl, regels en context — die in elk gesprek blijven bestaan. In tegenstelling tot één systeemprompt die verwatert in lange gesprekken, zijn Soul Engine-blokken geversioneerd, georganiseerd en worden ze altijd met prioriteit ingevoegd.
Met Environments kunt u geheugencontexten isoleren. Houd werk, persoonlijk en klantspecifieke herinneringen volledig gescheiden. Elke omgeving heeft zijn eigen memories, episodes, procedures en Soul-blokken. De AI wisselt van persoonlijkheid en kennis wanneer u van omgeving wisselt.
Begin op alma.olivares.ai. Het Starter-abonnement ($14/maand) bevat onbeperkte herinneringen op een wekelijks AI-budget van $2, 1 omgeving en volledige chattoegang. Alle integratiemethoden — MCP, SDK, API — werken in elk abonnement.
Voor meer diepgang: AI-geheugenbeheer: complete gids 2026 · AI-assistenten bouwen die alles onthouden · Permanent geheugen vs RAG