Permanent geheugen vs RAG: wat is het verschil

April 2026 · 10 min leestijd · Fran Olivares, oprichter van OlivaresAI

RAG haalt chunks op uit een statisch documentcorpus per zoekopdracht. Permanent geheugen verzamelt in de loop van de tijd gebruikersspecifieke feiten, voorkeuren en gedragingen en injecteert ze automatisch opnieuw. RAG vraagt „wat staat er in dit corpus?". Geheugen vraagt „wat weet de AI over deze gebruiker?". Ze lossen verschillende problemen op en de krachtigste AI-producten combineren beide.

Retrieval-Augmented Generation (RAG) en permanent geheugen zijn beide benaderingen om AI-systemen toegang te geven tot externe kennis. Ze worden vaak verward omdat ze enkele componenten delen — vector databases, embedding-modellen, retrieval-pipelines. Maar ze lossen fundamenteel verschillende problemen op, en het verschil begrijpen is cruciaal voor iedereen die in 2026 AI-producten bouwt.

Wat doet RAG eigenlijk?

RAG is een patroon voor het injecteren van relevante documenten in de context van een AI op queryniveau. De typische pipeline: chunk een documentcorpus, embed de chunks in een vector database, en op queryniveau, embed de vraag van de gebruiker, vind vergelijkbare chunks en neem ze op in de prompt. De AI genereert een antwoord op basis van de opgehaalde documenten.

RAG is uitstekend voor specifieke use cases: vragen beantwoorden over een kennisbank, zoeken in documentatie, een corpus onderzoekspapers analyseren. Het behandelt kennis als statische documenten die onafhankelijk van de gebruiker en het gesprek bestaan.

Wat doet permanent geheugen anders?

Permanent geheugen is een systeem voor het verzamelen, organiseren en ophalen van gebruikersspecifieke kennis die in de loop van de tijd evolueert. Het gaat niet om documenten — het gaat om feiten, voorkeuren, beslissingen, patronen en identiteit. De kennis wordt geëxtraheerd uit interacties, gescoord op relevantie en belangrijkheid, gededupliceerd, geconsolideerd en uiteindelijk gestopt wanneer het verouderd raakt.

Permanent geheugen beantwoordt een andere vraag dan RAG. RAG vraagt: welke informatie bestaat in dit documentcorpus? Permanent geheugen vraagt: wat weet de AI over deze specifieke gebruiker en hoe moet hij zich gedragen op basis van alles wat hij heeft geleerd?

Wat zijn de belangrijkste verschillen tussen RAG en permanent geheugen?

DimensieRAGPermanent geheugen
KennisbronReeds bestaande documentenGeëxtraheerd uit gesprekken + gebruikersinvoer
KennistypeTekstchunksGestructureerde feiten, voorkeuren, beslissingen, procedures
KenniscyclusStatisch (herindex bij documentwijziging)Dynamisch (aangemaakt, bijgewerkt, geconsolideerd, vervallen)
PersonalisatieHetzelfde voor alle gebruikers (gedeeld corpus)Per gebruiker (individueel cognitief profiel)
ScoringAlleen similariteitMultifactor: relevantie, belangrijkheid, vertrouwen, recentheid, frequentie
IdentiteitGeenSoul Engine (persoonlijkheid, regels, expertise, communicatiestijl)
GeheugenlagenEén (documentchunks)Drie (memories, episodes, procedures)
DeduplicatieOp chunkniveau (basis)Semantisch (Jaccard-similariteit + keyword-overlap)

Wanneer moet ik RAG gebruiken?

RAG is ideaal wanneer u een gedefinieerd kenniscorpus heeft dat gebruikers moeten kunnen doorzoeken: productdocumentatie, juridische contracten, onderzoekdatabases, interne wiki's. De kennis bestaat voordat de gebruiker ermee interageert, en verschillende gebruikers hebben meestal toegang nodig tot dezelfde informatie nodig. Als uw primaire doel „vragen beantwoorden over deze documenten" is, is RAG de juiste architectuur.

Wanneer moet ik permanent geheugen gebruiken?

Permanent geheugen is de juiste keuze wanneer de AI moet leren van de gebruiker in de loop van de tijd. Coderingsassistenten die uw tech stack en conventies onthouden. Persoonlijke AI die uw communicatiestijl en voorkeuren kent. Klantenondersteuningsbots die de geschiedenis en accountgegevens van een gebruiker onthouden. Onderzoeksassistenten die in weken van onderzoek context opbouwen. Elke use case waarin de AI beter moet worden naarmate u hem meer gebruikt, vereist permanent geheugen, geen RAG.

Kan ik RAG en permanent geheugen samen gebruiken?

De krachtigste AI-systemen combineren beide. RAG biedt toegang tot een gedeelde kennisbank. Permanent geheugen biedt gebruikersspecifieke context, voorkeuren en aangeleerde gedragingen. In de architectuur van Alma combineert contextsamenstelling al herinneringen (permanente kennis), episodes (gespreksgeschiedenis), procedures (geleerde workflows) en Soul-blokken (identiteit) tot één systeemprompt. RAG toevoegen als extra kennisbron is een natuurlijke uitbreiding.

De drielaagse geheugenarchitectuur van Alma is specifiek ontworpen voor de use case van permanent geheugen. Memories slaan feiten op. Episodes slaan gecomprimeerde gespreksgeschiedenissen op. Procedures slaan geleerde workflows op. De Soul Engine biedt consistente AI-identiteit. Samen geven ze uw AI iets wat RAG alleen niet kan: het vermogen om de gebruiker te kennen en in de loop van de tijd te verbeteren.

RAG of permanent geheugen: welke moet ik kiezen?

RAG en permanent geheugen zijn complementair, geen concurrenten. Als u een AI-product bouwt en moet kiezen tussen de twee, vraag uzelf: moet de AI een documentcorpus doorzoeken of moet hij leren van en individuele gebruikers onthouden? De meeste real-world applicaties hebben beide nodig. Begin met degene die uw meest urgente probleem oplost en voeg de andere toe wanneer u die nodig hebt.

Als permanent geheugen is wat u nodig hebt, biedt Alma het kant-en-klaar — volledige API, MCP-server en SDK.

See plans