April 2026 · 10 min leestijd · Fran Olivares, oprichter van OlivaresAI
Retrieval-Augmented Generation (RAG) en permanent geheugen zijn beide benaderingen om AI-systemen toegang te geven tot externe kennis. Ze worden vaak verward omdat ze enkele componenten delen — vector databases, embedding-modellen, retrieval-pipelines. Maar ze lossen fundamenteel verschillende problemen op, en het verschil begrijpen is cruciaal voor iedereen die in 2026 AI-producten bouwt.
RAG is een patroon voor het injecteren van relevante documenten in de context van een AI op queryniveau. De typische pipeline: chunk een documentcorpus, embed de chunks in een vector database, en op queryniveau, embed de vraag van de gebruiker, vind vergelijkbare chunks en neem ze op in de prompt. De AI genereert een antwoord op basis van de opgehaalde documenten.
RAG is uitstekend voor specifieke use cases: vragen beantwoorden over een kennisbank, zoeken in documentatie, een corpus onderzoekspapers analyseren. Het behandelt kennis als statische documenten die onafhankelijk van de gebruiker en het gesprek bestaan.
Permanent geheugen is een systeem voor het verzamelen, organiseren en ophalen van gebruikersspecifieke kennis die in de loop van de tijd evolueert. Het gaat niet om documenten — het gaat om feiten, voorkeuren, beslissingen, patronen en identiteit. De kennis wordt geëxtraheerd uit interacties, gescoord op relevantie en belangrijkheid, gededupliceerd, geconsolideerd en uiteindelijk gestopt wanneer het verouderd raakt.
Permanent geheugen beantwoordt een andere vraag dan RAG. RAG vraagt: welke informatie bestaat in dit documentcorpus? Permanent geheugen vraagt: wat weet de AI over deze specifieke gebruiker en hoe moet hij zich gedragen op basis van alles wat hij heeft geleerd?
| Dimensie | RAG | Permanent geheugen |
|---|---|---|
| Kennisbron | Reeds bestaande documenten | Geëxtraheerd uit gesprekken + gebruikersinvoer |
| Kennistype | Tekstchunks | Gestructureerde feiten, voorkeuren, beslissingen, procedures |
| Kenniscyclus | Statisch (herindex bij documentwijziging) | Dynamisch (aangemaakt, bijgewerkt, geconsolideerd, vervallen) |
| Personalisatie | Hetzelfde voor alle gebruikers (gedeeld corpus) | Per gebruiker (individueel cognitief profiel) |
| Scoring | Alleen similariteit | Multifactor: relevantie, belangrijkheid, vertrouwen, recentheid, frequentie |
| Identiteit | Geen | Soul Engine (persoonlijkheid, regels, expertise, communicatiestijl) |
| Geheugenlagen | Eén (documentchunks) | Drie (memories, episodes, procedures) |
| Deduplicatie | Op chunkniveau (basis) | Semantisch (Jaccard-similariteit + keyword-overlap) |
RAG is ideaal wanneer u een gedefinieerd kenniscorpus heeft dat gebruikers moeten kunnen doorzoeken: productdocumentatie, juridische contracten, onderzoekdatabases, interne wiki's. De kennis bestaat voordat de gebruiker ermee interageert, en verschillende gebruikers hebben meestal toegang nodig tot dezelfde informatie nodig. Als uw primaire doel „vragen beantwoorden over deze documenten" is, is RAG de juiste architectuur.
Permanent geheugen is de juiste keuze wanneer de AI moet leren van de gebruiker in de loop van de tijd. Coderingsassistenten die uw tech stack en conventies onthouden. Persoonlijke AI die uw communicatiestijl en voorkeuren kent. Klantenondersteuningsbots die de geschiedenis en accountgegevens van een gebruiker onthouden. Onderzoeksassistenten die in weken van onderzoek context opbouwen. Elke use case waarin de AI beter moet worden naarmate u hem meer gebruikt, vereist permanent geheugen, geen RAG.
De krachtigste AI-systemen combineren beide. RAG biedt toegang tot een gedeelde kennisbank. Permanent geheugen biedt gebruikersspecifieke context, voorkeuren en aangeleerde gedragingen. In de architectuur van Alma combineert contextsamenstelling al herinneringen (permanente kennis), episodes (gespreksgeschiedenis), procedures (geleerde workflows) en Soul-blokken (identiteit) tot één systeemprompt. RAG toevoegen als extra kennisbron is een natuurlijke uitbreiding.
De drielaagse geheugenarchitectuur van Alma is specifiek ontworpen voor de use case van permanent geheugen. Memories slaan feiten op. Episodes slaan gecomprimeerde gespreksgeschiedenissen op. Procedures slaan geleerde workflows op. De Soul Engine biedt consistente AI-identiteit. Samen geven ze uw AI iets wat RAG alleen niet kan: het vermogen om de gebruiker te kennen en in de loop van de tijd te verbeteren.
RAG en permanent geheugen zijn complementair, geen concurrenten. Als u een AI-product bouwt en moet kiezen tussen de twee, vraag uzelf: moet de AI een documentcorpus doorzoeken of moet hij leren van en individuele gebruikers onthouden? De meeste real-world applicaties hebben beide nodig. Begin met degene die uw meest urgente probleem oplost en voeg de andere toe wanneer u die nodig hebt.
Als permanent geheugen is wat u nodig hebt, biedt Alma het kant-en-klaar — volledige API, MCP-server en SDK.