AI-assistenten bouwen die alles onthouden

April 2026 · 11 min leestijd · Fran Olivares, oprichter van OlivaresAI

Bouw AI-assistenten met geheugen door permanent geheugen te behandelen als een eerste-klas architecturaal component, geen aanhangsel. Het patroon heeft vijf zaken nodig: automatische extractie, gestructureerde opslag, intelligente retrieval, contextsamenstelling en identiteitspersistentie. De snelste weg is de Alma MCP-server (5 minuten voor Claude Desktop / Cursor / Windsurf), de JavaScript SDK voor aangepaste apps of de REST API voor elke taal.

De meeste AI-assistenten zijn stateless. Ze verwerken een prompt, genereren een reactie en vergeten alles. Als u een product bouwt dat AI gebruikt — een coderingstool, een klantenondersteuningsbot, een onderzoeksassistent, een persoonlijke tutor — is deze statelessness uw grootste beperking. Uw gebruikers zullen dezelfde vragen stellen, dezelfde context geven en vertrouwen verliezen telkens als de AI iets vanzelfsprekends niet kan onthouden. Dit artikel doorloopt hoe u AI-assistenten bouwt die echt onthouden, met permanent geheugen als eerste-klas architecturaal component.

Waarom slagen de meeste AI-assistenten er niet in te onthouden?

Wanneer ontwikkelaars voor het eerst proberen geheugen toe te voegen aan een AI-assistent, grijpen ze meestal naar een van twee benaderingen: alles in de systeemprompt proppen of een RAG-pipeline (Retrieval-Augmented Generation) bouwen. Beide hebben ernstige beperkingen.

De systeempromptaanpak faalt op schaal. Contextvensters zijn eindig — zelfs met 200K tokens kunt u niet elk relevant feit, gesprek en voorkeur opnemen. En u betaalt voor elke token in de systeemprompt bij elke afzonderlijke aanvraag.

RAG is beter, maar onvolledig. Het lost retrieval van documenten op, maar behandelt niet de volledige levenscyclus van AI-geheugen: extractie, scoring, deduplicatie, consolidatie en vervaldatum. RAG haalt tekstchunks op. Geheugen begrijpt feiten, voorkeuren, beslissingen en gedragspatronen. Dit zijn fundamenteel verschillende problemen. (Zie onze gedetailleerde vergelijking: Permanent geheugen vs RAG.)

Wat heeft een AI-assistent met geheugen nodig?

Een echt nuttige AI-assistent met permanent geheugen heeft vijf mogelijkheden nodig:

  1. Automatische extractie — Het systeem moet feiten, voorkeuren en beslissingen uit gesprekken halen zonder dat de gebruiker iets expliciet hoeft op te slaan.
  2. Gestructureerde opslag — Niet alleen tekstchunks. Herinneringen hebben metadata nodig: categorie, belangrijkheid, vertrouwen, bron, tijdstempels en vector embeddings.
  3. Intelligente retrieval — Bij een nieuw gesprek moet het systeem de meest relevante herinneringen vinden met behulp van semantisch zoeken, keyword-matching en multifactor scoring.
  4. Contextsamenstelling — De opgehaalde herinneringen moeten worden geformatteerd en in de context van de AI worden geïnjecteerd op een manier die nuttig is en geen tokens verspilt.
  5. Identiteitspersistentie — Naast feiten heeft de AI een consistente persoonlijkheid, communicatiestijl en set gedragsregels nodig die sessies overleven.

Hoe voeg ik geheugen toe via de Alma MCP-server?

De snelste manier om permanent geheugen toe te voegen aan een AI-assistent is via het Model Context Protocol (MCP). Als uw assistent draait in Claude Desktop, Cursor, Windsurf of een MCP-compatibele client, kunt u in minder dan 5 minuten geheugen toevoegen.

Installeer de server globaal: npm install -g @olivaresai/alma-mcp. Voeg deze vervolgens toe aan uw MCP-clientconfiguratie met uw API-sleutel. De server biedt 35 tools waaronder alma_remember (sla een herinnering op), alma_recall (zoek herinneringen), alma_assemble (bouw volledige context op) en alma_extract (extraheer herinneringen uit tekst).

Eenmaal verbonden heeft de AI-assistent automatisch toegang tot permanent geheugen. Hij kan belangrijke feiten tijdens gesprekken opslaan en ze in toekomstige sessies ophalen. Het geheugen wordt opgeslagen aan de serverkant in Alma — onafhankelijk van het AI-model, de client of het gesprek.

Hoe voeg ik geheugen toe met de JavaScript SDK?

Voor aangepaste toepassingen geeft de JavaScript SDK (@olivaresai/alma-sdk) u volledige programmatische controle. Het typische integratiepatroon ziet er als volgt uit:

  1. Vóór de AI-aanroep — Roep client.context.assemble({ query: userMessage }) aan om relevante herinneringen, episodes en Soul-blokken op te halen, geformatteerd als systeemprompt.
  2. Tijdens de AI-aanroep — Geef de samengestelde context door als systeemprompt aan uw LLM-provider (Anthropic, OpenAI of een andere).
  3. Na de AI-aanroep — Roep client.memories.extract({ text: conversation }) aan om nieuwe feiten uit het gesprek op te slaan.

Dit patroon werkt met elke LLM-provider. Uw geheugenlaag is losgekoppeld van het model — wissel van Claude naar GPT-4 zonder ook maar één herinnering te verliezen.

Hoe voeg ik geheugen toe via de REST API?

De REST API biedt 140+ eindpunten voor volledig geheugenbeheer vanuit elke taal of platform. Belangrijkste eindpunten voor het bouwen van een assistent met geheugen:

Waarom is identiteitspersistentie anders dan geheugen?

Geheugen alleen is niet genoeg. Een AI-assistent die feiten onthoudt maar geen consistente persoonlijkheid heeft, voelt mechanisch aan. De Soul Engine van Alma biedt gestructureerde identiteitsblokken — geen enkele systeemprompt die ondergesneeuwd raakt, maar georganiseerde secties voor identiteit, persoonlijkheid, expertise, communicatiestijl, regels en context. Deze blokken zijn geversioneerd, altijd met prioriteit ingevoegd en per omgeving configureerbaar.

Bijvoorbeeld: u kunt definiëren dat de AI beknopt en technisch moet zijn in uw „werk"-omgeving, maar gesprekkelijk en uitleggend in uw „leer"-omgeving. Dezelfde herinneringen, andere persoonlijkheid. Dit is wat een AI-assistent doet aanvoelen als een echte collaborateur in plaats van een generieke chatbot.

Wat zijn veelvoorkomende fouten bij het bouwen van AI met geheugen?

Veelvoorkomende fouten bij het bouwen van assistenten met geheugen:

Hoe begin ik met het bouwen van een AI-assistent met geheugen?

De snelste weg: registreer u op alma.olivares.ai, haal een API-sleutel op via Instellingen en verbind via MCP, SDK of REST API. Het Starter-abonnement ($14/maand) bevat volledige API-toegang — genoeg om te prototypen en te valideren voordat u opschaalt.

See plans