Wat is AI-geheugenbeheer?

De discipline van het opslaan, organiseren, scoren, ophalen en laten vervallen van kennis die een AI-systeem in de loop van de tijd verzamelt. Het scheidt een chattool die elk gesprek vergeet van een AI-collaborateur die leert van elke interactie.

Waarom drie lagen (memories, episodes, procedures)?

Feiten, gebeurtenissen en workflows beantwoorden verschillende vragen. Ze samenvoegen levert slechter ophalen op. Memories slaan discrete feiten en voorkeuren op, episodes slaan gespreksamenvattingen op, procedures slaan geleerde workflows op. Elke laag heeft zijn eigen ophaal- en levenscyclusregels.

Hoe bepaalt scoring wat er wordt opgehaald?

Vijf gewogen factoren: relevantie (50%, semantische + keyword match), belangrijkheid (15%), vertrouwen (15%), recentheid (10%), frequentie (10%). Relevantie domineert zodat de juiste herinnering de meest recente verslaat — dit voorkomt de recentheidsbias-val.

Wat is de geheugenlevenscyclus?

Extractie (elke 4 berichten, 0–30 herinneringen), deduplicatie (Jaccard 60% + 3 gedeelde keywords), consolidatie (samenvoegen van bijna-duplicaten met behoud van hoogste vertrouwen) en vervaldatum (belangrijkheid < 0,1 en 120 dagen ongebruikt). Dit voorkomt geheugen-bloat dat de kwaliteit van het ophalen aantast.

AI-geheugenbeheer: complete gids 2026

April 2026 · 12 min leestijd · Fran Olivares, oprichter van OlivaresAI

AI-geheugenbeheer is de discipline van het opslaan, organiseren, scoren, ophalen en laten vervallen van kennis die een AI-systeem in de loop van de tijd verzamelt. In 2026 is het het verschil tussen een wegwerpchatbot en een echte collaborateur. Het patroon is een drielaagse architectuur (memories / episodes / procedures) plus scoring op vijf factoren (relevantie 50% / belangrijkheid 15% / vertrouwen 15% / recentheid 10% / frequentie 10%) plus een volledige levenscyclus (extract → dedup → consolidate → expire).

AI-geheugenbeheer is de discipline van het opslaan, organiseren, scoren, ophalen en laten vervallen van kennis die een AI-systeem in de loop van de tijd verzamelt. In 2026 is het de kritische onderscheidende factor geworden tussen AI-tools die aanvoelen als wegwerpchatbots en AI-systemen die functioneren als echte collaborateurs. Deze gids behandelt alles: van de fundamentele architectuurbeslissingen tot de praktische details van scoringsalgoritmen en contextsamenstelling.

Waarom is AI-geheugenbeheer belangrijk?

Zonder geheugenbeheer is elk AI-gesprek een geïsoleerde gebeurtenis. De gebruiker legt steeds opnieuw dezelfde context uit. De AI maakt dezelfde fouten waarvoor hij gisteren is gecorrigeerd. Beslissingen die drie weken geleden zijn genomen, zijn onzichtbaar. Dit is geen kleine ongemak — het is een fundamentele architecturale fout die beperkt hoe nuttig AI kan zijn in elke aanhoudende workflow.

De kosten zijn reëel: een onderzoek van Deloitte schatte dat kenniswerkers 20% van hun tijd besteden aan het zoeken naar of opnieuw creëren van informatie die al bestaat. Wanneer uw AI geen geheugen heeft, wordt dat percentage slechter, niet beter. U betaalt voor intelligentie die alles wat het leert vergeet.

Wat zijn de drie lagen van AI-geheugen?

Effectief geheugenbeheer vereist meer dan een platte key-value-opslag. Alma gebruikt een drielaagse architectuur die weerspiegelt hoe menselijke cognitie eigenlijk werkt:

1. Semantische herinneringen (feiten en voorkeuren)

Dit zijn discrete kennisitems: „De gebruiker geeft de voorkeur aan TypeScript boven JavaScript", „Het project gebruikt PostgreSQL 16", „Deadline van de klant is 15 maart". Elke herinnering heeft metadata — een categorie, belangrijkheidsscore (0,0 tot 1,0), vertrouwensniveau, bron en een vector embedding voor semantisch zoeken. Herinneringen zijn het fundament. Ze beantwoorden de vraag: wat weet de AI over deze gebruiker?

2. Episodes (gespreksamenvattingen)

Episodes zijn gecomprimeerde verslagen van wat er in eerdere gesprekken is gebeurd. Niet de volledige transcriptie — een gestructureerde samenvatting: wat is besproken, wat is besloten, wat is veranderd. Episodes beantwoorden de vraag: wat is er in de loop van de tijd gebeurd? Ze geven de AI een gevoel voor verhaal en voortgang.

3. Procedures (geleerde workflows)

Procedures zijn stapsgewijze patronen die de AI heeft geleerd uit herhaalde interacties. „Wanneer de gebruiker vraagt om te deployen, controleer eerst de testsuite, voer dan de migratie uit, deploy vervolgens naar staging." Procedures beantwoorden de vraag: hoe moet de AI zich gedragen in specifieke situaties?

Hoe bepaalt AI-geheugenscoring wat er wordt opgehaald?

Herinneringen opslaan is gemakkelijk. De juiste herinneringen op het juiste moment ophalen is het moeilijke probleem. Alma gebruikt een multifactor scoringsysteem met vijf gewogen dimensies:

Relevantie (50%) — Hoe semantisch dicht ligt deze herinnering bij het huidige gesprek? Gemeten door cosine-similariteit tussen vector embeddings.
Belangrijkheid (15%) — Hoe kritisch is deze herinnering? Door de gebruiker vermelde feiten scoren hoger dan afgeleide observaties.
Vertrouwen (15%) — Hoe betrouwbaar is de bron? Directe gebruikersuitspraken krijgen 1,0, LLM-inferenties krijgen 0,7, waargenomen patronen krijgen 0,5.
Recentheid (10%) — Hoe recent is deze herinnering aangemaakt of geraadpleegd? Exponentieel verval voorkomt dat verouderde informatie domineert.
Frequentie (10%) — Hoe vaak wordt naar deze herinnering verwezen? Vaak gebruikte herinneringen worden versterkt.

De gewichten zijn bewust gekozen. Relevantie is dominant omdat het primaire doel is de juiste herinnering te vinden voor de huidige context. Recentheid is bewust laag — een feit van drie maanden geleden is nog steeds een feit. Dit voorkomt het probleem van „recentheidsbias" waarbij AI-systemen nieuwe informatie prioriteren simpelweg omdat het nieuw is.

Hoe verandert contextsamenstelling geheugen in een systeemprompt?

Geheugen zonder ophalen is een database, geen intelligentie. Contextsamenstelling is het proces dat opgeslagen herinneringen omzet in een nuttige systeemprompt. In Alma gebeurt dit in minder dan 100 ms:

Query-uitbreiding — Het bericht van de gebruiker wordt geëmbed en gebruikt om alle drie de geheugenlagen parallel te doorzoeken.
Kandidaat ophalen — Tot 100 kandidaten uit Vectorize (semantisch zoeken) plus keyword-matches.
Scoring en rangschikking — Het multifactor scoringsysteem rangschikt alle kandidaten.
Tokenbudgettering — De hoogst gerangschikte herinneringen, episodes en procedures worden geselecteerd binnen het tokenbudget van het abonnement van de gebruiker.
Promptopbouw — Soul-blokken (identiteit, persoonlijkheid, regels) hebben prioriteit, dan herinneringen, dan episodes, dan procedures.

Hoe wordt de AI-geheugenlevenscyclus beheerd?

Herinneringen zijn standaard niet permanent. Alma implementeert een volledige levenscyclus:

Extractie — Na elke 4 berichten extraheert de achtergrondprocessor 0–30 herinneringen uit het gesprek met Claude Haiku.
Deduplicatie — Nieuwe herinneringen worden vergeleken met bestaande met behulp van Jaccard-similariteit (60% drempel met 3+ gedeelde keywords).
Consolidatie — Duplicaten en bijna-duplicaten worden samengevoegd, waarbij het hoogste vertrouwen en de meest recente bron worden behouden.
Vervaldatum — Herinneringen met belangrijkheid onder 0,1 die in 120 dagen niet zijn geraadpleegd, zijn kandidaten voor vervaldatum.

Deze levenscyclus voorkomt het probleem van „geheugen-bloat" waarbij AI-systemen duizenden herinneringen met lage waarde verzamelen die de kwaliteit van het ophalen aantasten.

Hoe zou ik mijn eigen AI-geheugensysteem moeten architecten?

Als u uw eigen AI-geheugensysteem bouwt, zijn dit de architecturale beslissingen die het meest van belang zijn:

Scheid opslag van ophalen — Uw vector database is niet uw geheugensysteem. U hebt scoring, levenscyclusbeheer en contextsamenstelling daarbovenop nodig.
Gebruik hybride zoeken — Puur semantisch zoeken mist exacte matches. Puur keyword zoeken mist conceptuele verbindingen. Combineer beide.
Budgetteer uw contextvenster — Alles wat de AI weet injecteren is slechter dan niets injecteren. Prioriteer meedogenloos.
Maak herinneringen bewerkbaar — Gebruikers moeten kunnen corrigeren, verwijderen en reorganiseren wat de AI weet. Een blackbox-geheugensysteem is een vertrouwensrisico.

Of sla het infrastructuurwerk helemaal over: Alma biedt dit allemaal kant-en-klaar. VolledigeREST API, MCP-server en JavaScript SDK voor ontwikkelaars die permanent geheugen in hun eigen tools willen integreren.

See plans