Wat is de eenvoudigste manier om AI permanent geheugen te geven?

Installeer de Alma MCP-server (@olivaresai/alma-mcp) in Claude Desktop, Cursor, Windsurf of een MCP-compatibele client. Installatie duurt ongeveer vijf minuten en vereist geen code — alleen het pakket toevoegen aan uw client-JSON-configuratie met uw Alma API-sleutel.

Heb ik een API-sleutel nodig om het permanente geheugen van Alma te gebruiken?

Ja. Registreer u op alma.olivares.ai, kies een betaald abonnement en genereer een API-sleutel in Instellingen. Dezelfde sleutel wordt gebruikt door de MCP-server, de JavaScript SDK en de REST API.

Kan ik het geheugen van Alma gebruiken met mijn eigen aangepaste AI-app?

Ja — gebruik de JavaScript SDK (@olivaresai/alma-sdk) voor Node.js of roep de REST API aan vanuit elke taal. Beide bieden 140+ eindpunten die geheugen-CRUD, semantisch en keyword zoeken, contextsamenstelling, Soul-blokken en chatstreaming dekken.

Werkt Alma met Claude, ChatGPT, Gemini of andere modellen?

Alma is modelonafhankelijk bij gebruik via de SDK of REST API: assemble context retourneert een gewone string die u kunt doorgeven aan elke LLM (Anthropic, OpenAI, Google, anderen). De web-app op alma.olivares.ai gebruikt Claude Haiku, Sonnet en Opus rechtstreeks.

Hoe u AI permanent geheugen geeft

April 2026 · 10 min leestijd · Fran Olivares, oprichter van OlivaresAI

Er zijn drie manieren om elke AI permanent geheugen te geven: installeer in vijf minuten een MCP-server zoals @olivaresai/alma-mcp in uw clientconfiguratie — geen code; gebruik de JavaScript SDK om context op te halen vóór LLM-aanroepen en herinneringen erna te extraheren; of roep de REST API direct aan vanuit elke taal. Alle drie verbinden met dezelfde Alma-geheugenlaag.

Elk AI-gesprek begint vanaf nul. Uw assistent vergeet uw naam, uw project, uw voorkeuren — telkens weer. Dit is de fundamentele beperking van stateless AI, en de grootste reden waarom AI aanvoelt als een tool in plaats van een collaborateur. Deze gids leidt u door drie concrete benaderingen om dit op te lossen, van installatie zonder code tot volledige API-integratie.

Waarom vergeet AI elk gesprek?

Wanneer u ChatGPT, Claude of een andere AI-chat gebruikt, verdwijnt de context wanneer het gesprek eindigt. U legt steeds weer dezelfde dingen uit: uw tech stack, uw codeerstijl, uw projectarchitectuur, uw voorkeuren. Dit verspilt tijd en levert slechtere resultaten op omdat de AI nooit een diep begrip opbouwt van wie u bent of waar u aan werkt.

Platformgebonden geheugenfuncties (ChatGPT Memory, Claude Projects) helpen, maar zijn beperkt in capaciteit, gebonden aan één platform en bieden geen ontwikkelaars-API. Als u een AI-gestuurd product bouwt, hebt u een onafhankelijke geheugenlaag nodig.

Hoe voeg ik geheugen toe via de MCP-server (geen code)?

Het Model Context Protocol (MCP) is de snelste weg. Als uw AI draait in Claude Desktop, Cursor, Windsurf, Claude Code of een MCP-compatibele client, kunt u in minder dan 5 minuten permanent geheugen toevoegen.

Stap 1: Registreer u op alma.olivares.ai en genereer een API-sleutel in Instellingen.

Stap 2: Voeg @olivaresai/alma-mcp toe aan uw MCP-clientconfiguratie met uw API-sleutel. Bewerk voor Claude Desktop claude_desktop_config.json. Gebruik in Cursor het MCP-instellingenpaneel.

Stap 3: Herstart uw client. De server biedt 35 tools: alma_remember (sla een herinnering op), alma_recall (zoek herinneringen), alma_assemble (bouw context uit alle geheugenlagen), alma_extract (extraheer feiten uit tekst) en meer. Uw AI kan nu lezen uit en schrijven naar een permanente geheugenopslag die elk toekomstig gesprek overleeft.

MCP is ideaal voor persoonlijke workflows — Claude Desktop voor algemeen AI-werk, Cursor voor coderen, Claude Code voor terminalgebaseerde ontwikkeling. Eén geheugen, overal.

Hoe integreer ik AI-geheugen met de JavaScript SDK?

De JavaScript SDK (@olivaresai/alma-sdk) geeft u volledige programmatische controle voor aangepaste toepassingen. Het kernintegratiepatroon heeft drie stappen:

Vóór de LLM-aanroep: Roep client.context.assemble({ query }) aan om een systeemprompt te krijgen die is verrijkt met relevante herinneringen, episodes, procedures en Soul-blokken.
Geef door aan elke LLM: De samengestelde context is een gewone string. Geef het door als systeemprompt aan Anthropic, OpenAI, Gemini of welk model dan ook. Uw geheugenlaag is modelonafhankelijk.
Na de LLM-aanroep: Roep client.memories.extract({ text }) aan om nieuwe feiten uit het gesprek op te slaan. Of maak herinneringen direct aan met client.memories.create().

De SDK wikkelt alle 140+ API-eindpunten met volledige TypeScript-typen. Installeer met npm install @olivaresai/alma-sdk. Het is alleen ESM en vereist Node.js 18+.

Hoe voeg ik AI-geheugen toe via REST API vanuit elke taal?

De REST API biedt directe HTTP-toegang vanuit elke taal of platform. Belangrijkste eindpunten:

POST /api/v1/context/assemble — Bouw een contextprompt op uit herinneringen, episodes, procedures en Soul-blokken
POST /api/v1/memories — Maak een herinnering aan met inhoud, categorie, belangrijkheid en vertrouwen
GET /api/v1/memories/search?q=query&mode=hybrid — Hybride semantisch + keyword zoeken
POST /api/v1/memories/extract — Op LLM gebaseerde extractie van feiten uit tekst
POST /api/v1/blocks — Configureer Soul Engine-blokken voor AI-identiteit

Authenticatie gaat via een API-sleutel (X-API-Key-header). Basis-URL: https://alma.olivares.ai/api/v1.

Hoe werkt de geheugenlaag van Alma eigenlijk?

De drielaagse architectuur van Alma verdeelt kennis in drie typen:

Memories — Discrete feiten en voorkeuren, semantisch geïndexeerd met vector embeddings. Elk heeft belangrijkheid, vertrouwen, categorie en bronmetadata.
Episodes — Gecomprimeerde gespreksamenvattingen. Wat is besproken, beslist en geleerd.
Procedures — Aangeleerde stapsgewijze workflows en gedragspatronen.

Wanneer u een gesprek begint, doorzoekt contextsamenstelling alle drie de lagen met hybride zoeken, scoort de resultaten op relevantie (50%), belangrijkheid (15%), vertrouwen (15%), recentheid (10%) en frequentie (10%) en injecteert vervolgens de hoogst gerangschikte context in de systeemprompt — alles in minder dan 100 ms.

Herinneringen worden automatisch elke 4 berichten uit gesprekken gehaald. De extractor identificeert 0–30 feiten per gesprek met Claude Haiku. Duplicaten worden gedetecteerd via Jaccard-similariteit (60% drempel) en samengevoegd. Verouderde herinneringen met lage belangrijkheid verlopen na 120 dagen inactiviteit.

Hoe geef ik mijn AI een consistente identiteit?

Geheugen alleen geeft uw AI feiten. De Soul Engine geeft hem identiteit. Configureer gestructureerde blokken — persoonlijkheid, expertise, communicatiestijl, regels en context — die in elk gesprek blijven bestaan. In tegenstelling tot één systeemprompt die verwatert in lange gesprekken, zijn Soul Engine-blokken geversioneerd, georganiseerd en worden ze altijd met prioriteit ingevoegd.

Hoe houd ik werk- en persoonlijke AI-contexten gescheiden?

Met Environments kunt u geheugencontexten isoleren. Houd werk, persoonlijk en klantspecifieke herinneringen volledig gescheiden. Elke omgeving heeft zijn eigen memories, episodes, procedures en Soul-blokken. De AI wisselt van persoonlijkheid en kennis wanneer u van omgeving wisselt.

Hoe begin ik met het gebruik van het permanente geheugen van Alma?

Begin op alma.olivares.ai. Het Starter-abonnement ($14/maand) bevat onbeperkte herinneringen op een wekelijks AI-budget van $2, 1 omgeving en volledige chattoegang. Alle integratiemethoden — MCP, SDK, API — werken in elk abonnement.

Voor meer diepgang: AI-geheugenbeheer: complete gids 2026 · AI-assistenten bouwen die alles onthouden · Permanent geheugen vs RAG

See plans